最新刊期

    2023 38 12

      材料物理

    • [{"title":"胆甾相液晶弹性体的研究进展","chapter":"1 引言","content":"固态、液态和气态是自然界中最为常见的3种物质状态,而液晶是一种介于液态和固态之间的物质。19世纪80年代奥地利植物学家F.Reinitzer加热胆固醇苯甲酸酯时发现其完全融化需两个升温过程,德国物理学家O. Lehmann根据这一观察并结合自己的实验,和F.Reinitzer共同将这类物质命名为液晶[1]。此后,液晶的知识体系逐渐丰富和完善。液晶既有液体的流动性,又部分保留了晶体的各向异性分子排布,其独特的物质状态决定了其特殊的物理化学性能。在电、热、磁等外场影响下,液晶会表现出一定的刺激响应性,这使得其拥有广阔的应用领域[2-6]。20世纪70年代,液晶显示器的发展使液晶技术迎来了重大突破,直到今天,液晶材料已广泛应用于手机、电脑、电视机等电子产品的显示屏幕中,成为信息时代不可缺少的材料之一。通常人们所说的液晶材料是指由小分子体系组成的液晶,相比聚合物体系对外界刺激更加敏感。另外,由于小分子体系的液晶分子主要依靠范德华力和偶极-偶极作用力相互连接,且液晶分子通常包含大量的刚性结构,小分子体系液晶的力学稳定性差,通常封装在液晶盒中,这限制了液晶材料在受力工作环境下的应用。1981年,Finkelmann提出了一种两步交联制备液晶弹性体(Liquid crystal elastomer, LCE)的方法,正式拉开了LCE研究的序幕[7]。LCE同时具备液晶的光学性质和弹性体的力学性能,其使用不再依赖液晶盒。近年来,研究人员研发了光[3]、热[8]和电[9]等外场响应的LCE致动器以及光、热响应的信息存储介质[10]等,大大拓宽了LCE的应用领域。Wang等人将LCE纤维与镀银尼龙绳编织到一起,镀银尼龙绳通电升温使LCE纤维发生可逆收缩,实现了LCE纤维作为机械臂的应用[11]。Chen等人利用两步交联法制备了一种柱状LCE材料,配合发电设备成功实现了光/热能-机械能-电能的二次能量转换[12]。Wang等人设计了一种电驱动的LCE/炭黑双层软致动器,其原理是炭黑层通电后升温,加热液晶层导致局部弯曲变形,从而实现筒形滚动[13]。与LCE相比,胆甾相液晶弹性体(Cholesteric liquid crystal elastomer, CLCE)由于其具有独特的螺旋结构,导致入射光的选择性布拉格反射,而螺旋结构的螺距对外力、温度等因素十分敏感,可同时实现光的选择性反射[14]、力致变色[15]和刺激形变[16],在保留LCE弹性的基础上增加了反射色可调节的性能,引起了越来越多研究人员的关注。本文介绍了CLCE的基本特点,并综述了近年来研究人员在其制备、外场调控以及应用方面的进展。最后,对CLCE材料未来的优化和应用进行了展望。","result":"介绍了液晶的独特物质状态及其介于液态和固态之间的特性,以及液晶材料在电子显示屏幕中的广泛应用。详细讨论了液晶弹性体(LCE)的发展历程,包括其光学性质和力学性能,以及在光、热和电等外场响应方面的应用。特别强调了胆甾相液晶弹性体(CLCE)由于其螺旋结构带来的选择性布拉格反射和对外界刺激的敏感性,使其在光反射、力致变色和刺激形变方面具有特殊性能。最后,对CLCE材料的制备、外场调控和应用进展进行了综述,并对其未来发展进行了展望。","language":"zh"},{"title":"胆甾相液晶弹性体的研究进展","chapter":"2 胆甾相液晶弹性体","content":"2.1 胆甾相液晶弹性体简介根据液晶分子的排列方式,液晶可以分为向列相液晶(Nematic liquid crystal, NLC)、胆甾相液晶(Cholesteric liquid crystal, CLC)和近晶相液晶(Smectic liquid crystal, SLC)等,图1(a)展示了NLC的分子排列方式。CLC是最为著名的手性液晶,在假想平面上分子排列与NLC相似,相邻的假想平面之间分子的指向矢发生变化,整体呈现出连续的螺旋结构,如图1(b)所示。液晶分子的指向矢每旋转360°为一个周期,两端分子所在的两个假想平面之间的距离被称为螺距(pitch),图1(b)展示了1/2的螺距。图1(a) NLC和(b) CLC的结构示意图Fig.1Schematic diagram of structure of (a) NLC and (b) CLC螺旋结构的存在使得CLC具有旋光性、选择性光散射和圆偏振光二色性等光学性质,同时符合布拉格反射定律: ,(1) ,(2)其中:n和p分别代表平均折射率和螺距,no为寻常光折射率,ne为非寻常光折射率。体系确定时n为常数,反射波长与螺距直接相关,调节螺距可以改变反射光波长。另外,反射光是与自身螺旋结构旋向相同的圆偏振光,这意味着当非偏振光入射时,反射率最高只能达到50%[17]。CLCE保留了上述CLC的光学性质,但与之不同的是,CLCE是由可聚合液晶单体与交联剂组成的聚合物体系,单体之间反应生成聚合物分子链,聚合物分子链之间适度交联形成三维网状结构,如图2所示。这使CLCE具有高弹性、可回复的优点,使作为智能材料的液晶增加了力学响应这一新的维度。图2CLCE的结构示意图Fig.2Schematic diagram of CLCE structure经过多年的努力,CLCE领域取得了长足的发展,研究人员逐渐对其产生了系统的认识,通过调整其组分或制备方法,使其具备特定的性能,从而实现了力学、温度、光、电场等多维度的调控,如图3所示[18-22]。图3CLCE的刺激响应性Fig.3Stimuli-responsiveness of CLCE2.2 胆甾相液晶弹性体的制备2.2.1 胆甾相液晶弹性体的聚合方法在NLC中加入手性分子是制备小分子体系CLC的一种方法[23],对于聚合物体系的弹性体来说也是如此。通常,CLCE的组分包括可聚合单体、手性掺杂剂以及其他添加剂(交联剂、光引发剂等),图4列举了一些常用组分的分子结构。目标聚合物的性能不同,组分及其配比也会相应有所改变。聚合过程与传统弹性体类似,小分子之间发生反应形成分子链,分子链之间适度交联形成聚合物三维网络结构。目前,聚合方法主要分为两步交联法和原位聚合法。图4CLCE体系中的常用组分的分子结构Fig.4Molecular structures of the components commonly used in CLCE system两步交联法是先制备出液晶预聚物,再引发交联聚合得到CLCE。Ma等人通过两步交联法制备了一种性能优异的CLCE,制备过程首先将混合好的液晶单体、手性剂、交联剂、光引发剂等原料倒在玻璃基板上,在室温下发生硫醇-丙烯酸酯迈克尔加成反应,反应24 h后得到预聚物。然后使用365 nm紫外光照射预聚物5 min发生光聚合,最终得到CLCE[24]。图5(a)展示了两步交联法制备CLCE的反应过程。图5(a)两步交联法和(b)原位聚合法制备CLCE的流程图Fig.5Schematic diagram of CLCE preparation using (a) two-step crosslinking procedure and (b) in situ polymerization原位聚合法是将液晶单体和交联剂同时反应一步制备CLCE。Varanytsia等人通过原位聚合法制备了一种染料掺杂的侧链型CLCE,柔性主链提供“流动性”,侧链的液晶单体各向异性取向,提供有序性。实验过程中将手性单丙烯酸酯液晶单体、二丙烯酸酯交联剂、光引发剂等原料灌入具有摩擦聚酰亚胺涂层的液晶盒中,在10 ℃下冷却排列取向,然后使用526 nm光照射液晶盒引发光聚合完成制备[25]。图5(b)展示了原位聚合法制备CLCE的反应过程。相比于两步交联法,原位聚合法在聚合前利用液晶盒中的取向层对小分子单体进行取向,制品的取向程度更高。但是由于液晶盒的限制,原位聚合法难以制备大尺寸的CLCE。对于CLC来说,单一的螺旋轴方向是其宏观上表现出选择性反射的必要条件,也对其他性能有着关键性的影响。为此,CLCE制备过程中需要采取一定的取向措施。2.2.2 胆甾相液晶弹性体的取向方法2001年,Kim等人首次使用各向异性去溶胀法制备了CLCE。首先为硅氢化反应离心5 h,然后为蒸发溶剂离心5 h,最后将得到的弹性体烘干24 h[26]。此方法成功实现了螺旋轴均匀的垂直分布,但是离心过程较为繁琐。Kizhakidathazhath等人改进了上述取向方法,利用溶剂的单向挥发(z轴)限制了溶胀只发生在垂直方向上,如图6(a)所示,导致液晶的指向矢在平面内取向,进而实现螺旋轴的垂直分布。使用此取向方法,并采用硫醇-丙烯酸酯迈克尔加成与光聚合的两步交联法得到了大面积、具有均匀反射色、可机械变色的CLCE薄膜,如图6(b)和图6(c)所示[27]。图6(a)溶剂蒸发方向;(b)大尺寸的CLCE薄膜;(c)薄膜的机械变色。Fig.6(a) Solvent evaporation direction; (b) Large size CLCE film; (c) Mechanochromic property of the film.Hisano等人利用具有理想机械响应行为的多层薄膜材料,成功对LCE宏观变形和分子取向变化的恢复进行了调节。改变外层材料(具有弹性响应的聚二甲基硅氧烷薄膜或具有塑性响应的聚甲基戊烯薄膜)将松弛时间调节到小于1 s或大于6个月。制备过程中先在玻璃片上形成聚二甲基硅氧烷(PDMS)弹性体膜,然后使用这样两块内测涂敷PDMS层的玻璃片组装成液晶盒,利用间隔球控制层厚,通过毛细力将CLC单体混合物注入到液晶盒中,将液晶盒的上下两层玻璃片单轴摩擦,从而对盒中的CLC混合物施加剪切应力以使小分子排列取向,最后通过光交联聚合形成交联网络,如图7所示[18]。该取向方法操作简单,但取向程度有时难以满足需要,通常配合拉伸取向法使用。图7(a) CLC层所用的分子;(b)多层薄膜制备流程图。Fig.7(a) Molecules used in the CLC layer; (b) Schematic diagram of fabrication of multilayered film.拉伸取向法也是目前常用的一种取向方法。该方法通过施加单轴应变使液晶分子主轴趋向于拉伸轴,进而交联固化,完成取向。Zhang等人通过两步交联和拉伸取向得到了具有超高反射率的CLCE薄膜。图8(a)展示了制备CLCE所用分子的结构式。通过拉伸部分交联的薄膜产生畸变螺旋结构,并光聚合使之完全交联固定该结构,实现了左旋、右旋圆偏振光的等量反射,如图8(b)所示[28]。图8(a) CLCE薄膜所用的分子;(b)薄膜制备流程图。Fig.8(a) The molecules used for CLCE film; (b) Schematic diagram of fabrication process of the film.2.3 胆甾相液晶弹性体的动态调控CLC特殊的螺旋结构使其对电、光、热等外场有着多重的刺激响应性,而CLCE又将液晶性质与弹性体的力学性能结合到一起,赋予了液晶力学响应这一更为直接的调控手段,对液晶领域的发展具有十分重要的意义。2.3.1 力学调控制备弹性体的目的是使其具有一定的力学性能,所以,力学调控是CLCE主要的调控手段。Finkelmann等人早在2001年就提出了一种力调控的CLCE激光器。使用各向异性去溶胀法制备了一种染料掺杂的侧链型CLCE薄膜。通过双轴延伸实验证明了垂直于螺旋轴的双轴拉伸或平行于螺旋轴的单轴压缩会同时导致螺旋结构螺距的减小,反射色蓝移。通过测量发射激光的强度曲线,证实了该弹性体激光发射的机械可调谐性[29]。CLCE的变色范围受到材料拉伸性能的限制,通常表现出较低的变色范围和颜色对比度。Sun等人提出了一种具有力诱导的协同色素和结构颜色变化的机械变色仿生LCE(BLCE),通过掺杂纳米粒子使弹性体薄膜在受到外力时产生应力集中,更易触发螺旋吡喃基分子的力致变色效应。如图9(a)所示,薄膜宏观的拉伸变色效果是拉伸过程中螺距减小导致的反射色蓝移和螺旋吡喃基分子力致变色共同作用的结果。通过该方法使得在相同应变下,纳米粒子掺杂的弹性体具有更宽的变色范围,并且机械变色灵敏度更高,如图9(b)所示[30]。图9(a) BLCE薄膜的机械变色机理示意图;(b) BLCE薄膜在不同伸长率下的实物照片。Fig.9(a) Schematic diagram of mechanochromic mechanisms of the BLCE film; (b) Photograph of the BLCE sample at different elongations.Li等人将纤维素纳米晶体(CNC)作为液晶骨架,可聚合共晶溶剂(PDES)作为基体制备了一种具有CLCE特征的复合物弹性体,这种弹性体具有拉伸变色性能、超高断裂伸长率、自愈合性能和电学性质。伸长率在0~450%之间,复合物弹性体表现出由红到紫的反射色变化,并且断裂伸长率到达了惊人的1 163.7%。在可逆循环测试(100%拉伸应变)超过1 000次的快速循环过程中,作为传感器的弹性体保持稳定的信号输出,样品的结构颜色呈现由红色到黄色的可逆变化。当应变范围改变为10%、50%、100%、200%和300%时,输出的传感信号和动态结构颜色保持稳定[31]。目前对CLCE机械变色的研究大多聚焦在单轴拉伸的情况。Kwom等人研究了CLCE在单轴、双轴以及面外拉伸条件下,螺旋结构以及光学性质的变化。拉伸前的螺旋结构会导致CLCE仅反射与螺旋结构旋向相同的圆偏振光;单轴拉伸时,螺旋沿单轴拉伸方向展开,形成畸变螺旋结构,同时反射左旋、右旋圆偏振光,如图10(a)所示;双轴拉伸时,螺旋结构只发生螺距的变化,单旋向圆偏振反射现象保持不变,如图10(b)所示;面外拉伸即沿各方位角施加等效应变,螺旋结构的变化与双轴拉伸时类似,如图10(c)所示。这项工作为今后的偏振选择性应用提供了重要的思路[32]。图10(a)单轴、(b)双轴和(c)面外拉伸时在右旋、左旋圆偏振片下的实物照片。Fig.10Photograph of color changes through circular pola‑rizers under (a) uniaxial, (b) biaxial and (c) out-of-plane stretching.Han等人制备了一种主链CLCE,并放置于上下两层透明的聚二甲基硅氧烷薄膜中间,实现了一种多模态、瞬时响应、可感应任意复杂面内变形的传感器。图11展示了膜的颜色在应用于面外弯曲、面内弯曲和3D非零高斯表面弯曲时的变化情况。图11弹性体薄膜(a)面外弯曲、(b)面内变形和(c)非零高斯变形时的实物照片。Fig.11Photograph of the elastomer film under (a) out-of-plane bending,(b) in-plane deformation and (c) nonzero Gaussian deformation.结果表明,制备的主链CLCE表现出较宽的反射带位移,机械变色较为敏感。根据表观颜色和变色部位可以清晰直观地得到受力大小以及受力位置等信息,在软机器人、可穿戴设备中有广阔的应用前景[33]。2.3.2 光调控光调控是一种无接触、可远程的调控方式,在智能材料中有着广阔的应用。在液晶中加入可光异构的偶氮苯衍生物[34]和二芳基乙烯类衍生物[35]、氰芪衍生物[36-39]等光开关材料是实现液晶光调控的常用方法[40-41]。Sol等人提出了一种由单一偶氮苯功能化CLC低聚物墨水生产的4D多模态光响应致动器。液晶低聚物墨水由硫醇-丙烯酸酯迈克尔加成反应得到。墨水可沉积成平面胆甾相(Ch)、倾斜胆甾相(sCh)以及单轴伪向列相(N)3种有效中间相态。这3种不同中间相的光学性质与驱动特性不同,由此产生的装置在蓝光和紫外光照射下,同时发生结构色变化以及光致驱动。如图12(a)所示,Ch/PEI双层膜和N/PEI双层膜在365 nm和455 nm光照下发生向光弯曲,而sCh/PEI双层膜则是背光弯曲。利用这一原理,实现了更为复杂的分段弯曲行为,如图12(b)和图12(c)所示[42]。图12(a) 3种有效中间相对两种光照的刺激响应;(b)分段弹性体的照片;(c)分段弹性体的复杂光驱动行为。Fig.12(a) Stimulus response of three effective mesophases to two kinds of light; (b) Photograph of the segmented elastomer; (c) Complex photo-actuation behavior of segmented elastomer.Zhang等人在CLCE体系中加入了两种偶氮苯衍生物,使之具有光驱动和光致变色两种性能。如图13(a)所示,制备的条状薄膜初始平坦并表现出绿色的反射色(左图)。在405 nm蓝光照射下,制备的弹性体条状薄膜迅速发生弯曲,并且反射色从初始的绿色变为橙黄色,反射率从40%急剧降低为0.1%(右图)。移除蓝光,薄膜仍然保持弯曲状态。施加532 nm绿光照射会使之回复到初始状态。该实验证实了光驱动和光致变色都是由于偶氮苯衍生物的光异构化:405 nm光照可定向调整聚合物链来诱导偶氮苯聚合物的变形,并且蓝光照射导致偶氮苯分子从反式光异构到顺式,降低了Tg,使聚合物柔性增加;光异构化影响CLC分子排列,螺旋结构变形,反射率急剧下降,表现出材料自身的颜色,如图13(b)所示[43]。图13(a) CLCE薄膜的可逆光致动和光致变色的实物照片和光照前后的反射光谱;(b)可逆光致动和光致变色原理的示意图和POM图像。Fig.13(a) Photographs of the reversible photo-actuation and photochromism of the CLCE film and the reflection spectra before and after light; (b) Schematic diagram of the reversible photo-actuation and photochromism and the POM image.除了利用偶氮苯衍生物的光异构化实现光致动,还可以利用光引发的链转移反应、掺杂具有光热效应的分子使CLCE获得光响应性。Martinez等人通过巯基-迈克尔加成反应合成了液晶双丙烯酸酯低聚物,并将低聚物、光引发剂、手性剂均匀混合滴在玻璃基板上,通过摩擦取向以及反复的升降温过程增强胆甾相,最后使用可见光引发丙烯酸酯均聚从而完全交联,获得了具有加成断裂链转移(AFT)能力的CLCE。光启动AFT实现可逆键交换,使该弹性体具有可重新编程能力。对薄膜施加100%单轴应变,并用紫外光持续","result":"详细介绍了胆甾相液晶弹性体(CLCE)的基本概念、结构特点、制备方法、取向技术以及动态调控方式。首先,解释了胆甾相液晶(CLC)分子的排列方式,其具有连续螺旋结构,展现出旋光性、选择性光散射和圆偏振光二色性等独特光学性质。CLCE结合了CLC的光学性质和聚合物网络的高弹性,使其在智能材料领域具有广泛的应用潜力。\n\n在制备方法方面,讨论了两步交联法和原位聚合法两种主要的聚合技术,以及它们在制备过程中的应用和特点。两步交联法通过先形成预聚物再进行光聚合,而原位聚合法则是直接将单体和交联剂混合反应。此外,还介绍了取向方法,包括各向异性去溶胀法、溶剂蒸发法、多层薄膜材料法和拉伸取向法,这些方法对实现CLCE的宏观性能至关重要。\n\n章节进一步探讨了CLCE的动态调控,特别是力学调控和光调控。力学调控通过改变CLCE的螺旋结构螺距来实现颜色变化,而光调控则利用光异构化或光引发的化学反应来改变材料的光学和力学性能。介绍了多种通过力学和光调控实现颜色变化的实例,如力调控的CLCE激光器、具有力诱导变色效应的仿生LCE、以及光响应的4D多模态致动器等。\n\n此外,还讨论了CLCE在软机器人、可穿戴设备中的应用前景,以及如何通过纳米粒子掺杂、纤维素纳米晶体和可聚合共晶溶剂的复合等手段来提高CLCE的性能。最后,提到了光引发的链转移反应和光热效应分子掺杂,这些方法为CLCE提供了新的光响应途径,展示了其在智能材料领域的发展潜力。","language":"zh"},{"title":"胆甾相液晶弹性体的研究进展","chapter":"3 总结与展望","content":"作为一种新型的软智能材料,CLCE引起了研究人员的广泛关注。CLC螺旋结构的存在使其具有选择性反射、旋光性、圆二色性等特点。将液晶的光学性质与弹性体优异的力学性能相结合,CLCE表现出对力、光、热等外界条件的刺激响应性,使人们对液晶的应用更加多元。外界刺激使CLCE的螺旋结构改变,同时也可能发生胆甾相-各向同性态转变,宏观表现为CLCE的机械变色、刺激形变、圆偏振选择性的变化等现象,在光学传感、软致动器、柔性显示、4D打印、信息加密防伪等领域有着广阔的应用前景。但是目前研究人员对CLCE材料的研究仍有不足。首先,在制备方面,现阶段制备的CLCE薄膜面积较小,难以实现批量生产,需要进一步优化各向异性去溶胀法或者探索更优的方法,在保证均一取向的同时制备大面积薄膜。在取向方法方面,去溶胀法制备过程中的液晶取向通常需要较长时间,而可保持CLC螺旋结构的双轴拉伸取向法为解决均一取向大面积薄膜的制备提供了可能性。其次,在材料性能方面,现阶段制备的CLCE材料的性能难以满足在现实生活中复杂环境下长期使用的需求,需要尝试不同的可聚合液晶单体、手性单体、交联剂的种类和配比来构筑更为完善的聚合物体系,也可以通过优化聚合方法以及掺杂纳米粒子等手段来提升对外界刺激响应的高可重复性和长期使用的高信赖性。最后,在应用方面,应当充分展现CLCE与LCE的差别,即在兼顾力学性能基础上同时体现CLCE的光学性能,这就意味着需进一步探索CLCE在信息显示、存储与加密、以及防伪等领域的潜在应用。同时,在致动器及软体机器人应用领域,CLCE在可发生各种形变时,其同时展现的光学性质变化能够进一步丰富构筑的器件或材料体系的功能。","result":"总结了胆甾相液晶弹性体(CLCE)作为新型软智能材料的研究进展,指出其结合了液晶的光学特性和弹性体的力学性能,具有刺激响应性,广泛应用于光学传感、软致动器等领域。然而,CLCE材料研究存在制备面积小、性能不足等问题,需优化制备方法、探索新的取向技术、改进聚合物体系和聚合方法,以及掺杂纳米粒子提升性能。同时,应进一步探索CLCE在信息显示、存储、加密和防伪等潜在应用,以及在致动器和软体机器人领域的功能拓展。","language":"zh"}]
      任天淇,郭金宝
      2023, 38(12): 1615-1630. DOI: 10.37188/CJLCD.2023-0272
      摘要:胆甾相液晶弹性体(Cholesteric liquid crystal elastomer, CLCE)是一种新型的软智能材料,它将胆甾相液晶(Cholesteric liquid crystal,CLC)独特的光学性质与弹性体优异的力学性能结合到一起。相较于普通的CLC,CLCE具有可逆、无延迟的力学调控能力,将CLC刺激响应性的利用提升到了新的高度,在信息加密防伪、柔性致动器、力学传感等领域引起了越来越多的关注。随着相关研究的深入,CLCE的制备方法不断完善,材料性能不断提高,CLCE的各种潜在应用被挖掘出来。本文介绍了CLCE的基本特点、制备与取向方法,以及不同类型的外场刺激响应行为,并对CLCE的应用前景进行了展望。  
      关键词:胆甾相液晶弹性体;力致变色;刺激响应性;智能材料   
      866
      |
      185
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42232427 false
      发布时间:2024-07-28
    • [{"title":"面向量子点电致发光二极管的蓝光InP和ZnSe量子点研究现状","chapter":"1 引言","content":"作为信息展现载体,显示设备在生产生活中扮演着极其重要的角色,科学技术的不断进步推动着显示设备的迅速升级和发展,研发高质量显示器的重要性不言而喻[1]。显示设备的发展经历了数个阶段,从最初的阴极射线管显示器(Cathode Ray Tube,CRT)逐步发展到液晶显示器(Liquid Crystal Display,LCD),再到近些年占据大量市场份额的有机发光二极管显示器(Organic Light-Emitting Diodes,OLED),每一次的进步都代表着光电材料领域的新突破,可以说,显示器的发展史同样是材料的发展史[2]。历经数十年发展,LCD和OLED均已实现规模化商业应用,但仍面临以下难题亟待解决:LCD显示器存在结构复杂、功耗高、对比度差、发光强度低等缺点[3];OLED显示器以有机材料作为发光源,其发光寿命和发光稳定性会受到环境较大的影响,且色域只能达到BT 2020标准的70%左右[4]。而量子点发光二极管(Quantum Dot Light-Emitting Diodes,QLED)新型显示技术可有效解决以上难题以更好地满足市场对高质量显示器的需求。量子点又被称为纳米晶,是由几百到数万个原子组成的一种纳米材料,尺寸一般介于2~10 nm之间[5]。不同于块体材料所具有的连续导带和价带,当纳米量子点的粒径小于或接近于其激子波尔半径时,电子波函数的运动将会受到限制从而产生量子限域效应,该效应导致原本连续的导带和价带能级分立同时伴随着带隙展宽,从而表现出与块体材料不同的光电性质[6]。通过控制反应条件改变量子点尺寸可以获得不同发射波长的量子点材料,量子点所具有的发光波长连续可调、荧光量子产率高和最大半峰全宽窄等诸多优点,为QLED器件在发光显示领域奠定了重要基础,并有望生产出前所未有的宽色域、高色准、大面积的高质量显示器[7-9]。电致发光量子点发光二极管(QLED)是一种以量子点作为直接发光源的光电器件,与LCD和OLED相比,其具有显色精准、色域面积广、寿命长、光电转换效率高、产热量低及工作稳定等一系列优点[10-14]。通过提升发光层材料性能和优化器件结构,以镉基量子点材料制备的红光、绿光和蓝光QLED器件可分别达到20.5%、22.9%和19.8%的外量子效率(External Quantum Efficiency,EQE),同时具有超高的电致发光亮度,其中红光、绿光和蓝光QLED的发光亮度分别为13 300 cd/m2、52 500 cd/m2和10 100 cd/m2[15-17]。当前性能最佳的蓝光量子点材料主要为镉基硫化物量子点和铅基钙钛矿型量子点,如CdSeS、ZnCdS以及CsPbBr3、CsPbCl3等。尽管上述材料有着亮眼的蓝光发射性能,但作为重金属有毒元素,镉和铅的化学毒性势必会对人类健康构成威胁甚至引发严重的环境污染问题。欧盟法规严格限制在消费级电子产品中使用重金属有毒元素[18-22]。研发优异发光性能且满足环保要求的蓝光量子点材料对促进QLED实现规模化商用起着至关重要的作用[23-26]。经过数十年发展,研究人员已经开发出多种环境友好型蓝光量子点材料,其中有代表性的当属ZnSe和InP。这两类量子点材料均可通过热注入法制备,在满足无镉无铅、环境友好的前提下,仍表现出优异的蓝光发射性能,被认为是镉、铅基量子点最有希望的替代者[27-29]。本文针对这两类蓝光量子点材料的研究近况进行了综述,并对蓝光量子点材料及其QLED电致发光器件未来的发展方向进行了展望。","result":"介绍了显示设备在信息展现中的重要性,以及显示技术从CRT到LCD再到OLED的发展历程。指出LCD和OLED存在的结构复杂、功耗高、对比度差、发光强度低和发光寿命短等问题。强调了量子点发光二极管(QLED)作为新型显示技术,具有显色精准、色域广、寿命长等优点,有望解决现有显示技术的问题。量子点材料的量子限域效应使其具有发光波长连续可调、荧光量子产率高等特性,为QLED提供了重要基础。镉基和铅基量子点材料虽然性能优异,但存在化学毒性问题。ZnSe和InP量子点作为环境友好型蓝光量子点材料,具有无镉无铅、优异蓝光发射性能等优点,被认为是理想的替代材料。本文综述了ZnSe和InP量子点的研究现状,并展望了蓝光量子点材料及其QLED器件的发展方向。","language":"zh"},{"title":"面向量子点电致发光二极管的蓝光InP和ZnSe量子点研究现状","chapter":"2 无镉无铅型蓝光量子点","content":"尽管镉基硫化物和铅基钙钛矿型蓝光量子点材料有着优异的光电性能,但镉和铅作为重金属有毒元素,在消费级显示设备中的大量使用难免会对人体健康构成威胁,甚至引发严重的环境污染问题。实现无毒无污染的高质量蓝光发射并最终实现QLED产业化是一项艰巨的挑战。针对环保型蓝光量子点材料的研究从未间断,过去的数年间,涌现出一批有着优良蓝光发射性能的量子点材料,如Ⅱ-Ⅵ族材料ZnSe和Ⅲ-Ⅴ族材料InP,这两类材料在满足无毒无污染的前提下,仍表现出较亮眼的蓝光发射性能以及作为蓝光QLED器件发光层的潜力。2.1 InP量子点InP因具有较宽的可调发光波长范围和低毒性而受到广泛关注,理论上通过控制InP量子点的尺寸便可使其发光峰在可见光范围内进行调节[30-31]。基于InP量子点制备的红光和绿光QLED器件具有优异的光电性能。Won等人报道了一种InP/ZnSe/ZnS双壳层结构红光量子点器件,EQE可达到21.4%,最大亮度超过100 000 cd/m2,在100 cd/m2的亮度下具有100万小时的发光寿命[32]。然而InP材料的本征带隙较窄(1.35 eV),其发光波长很难达到蓝光范围,除非将其粒径限制在1~2 nm内。精准控制InP量子点的粒径大小对热注入合成法来说仍是一项挑战,此外低毒性磷前驱体的种类较少、InP材料不稳定极易被氧化等原因也限制了单体InP作为高性能蓝光量子点材料的可行性。合成高质量蓝光InP量子点的路径主要分为两大方向:一是优化InP核的尺寸,随着InP尺寸的减小,其发光波长也逐渐蓝移从而获得蓝光发射;二是对InP量子点进行适当的壳层包覆,InP核包覆ZnS壳层不仅可以防止InP核被氧化,提高其稳定性,还能作为阻挡层抑制InP核的长大,达到小尺寸蓝光发射的目的,并降低非辐射荧光共振能量转移的概率进而提高量子效率。直接合成极小尺寸的InP量子点较为困难,通过改变InP的合成条件或向反应溶剂中添加辅助配体可以达到抑制量子点生长的效果。Xie等人通过调节pH和交换表面配体,在较低温度下制备出尺寸可控的水溶性InP/ZnS量子点,光致发光量子产率(Photoluminescence Quantum Yield,PLQY)可达到40%,最大半峰全宽(Full Width at Half Maximum,FWHM)为90 nm[33]。2012年Lim等人在130 ℃的反应温度下,利用反应前驱体中剩余的乙酸来调控InP量子点合成过程中的成核及生长过程,通过乙酸不停地“刻蚀”粒径较大的量子点,使得InP粒子尺寸始终保持在较小水平,随后进行ZnS壳层包覆,在保证蓝光发射的同时还合成出尺寸均匀的量子点,最终制得发光波长峰值为475 nm和FWHM为39 nm的InP/ZnS核壳量子点[34]。InP上包覆的ZnS能够作为阻挡层抑制InP核的长大,达到小尺寸蓝光发射目的[35]。Suh等人研究了一种新颖的ZnS包壳方式,如图1(a~e)所示,即在InP核形成之前预先在溶液中合成出少量“初始”ZnS壳,随着P前驱体注入反应溶液,In离子和P离子开始反应产生InP核,此时ZnS开始在新形成的InP表面迅速形成壳层来抑制核的过度生长,得到了粒径仅为1.8 nm的InP核。随后再继续添加Zn和S的前驱体增加ZnS壳层的厚度,制备的厚壳层InP/ZnS量子点实现了峰值为483 nm的天蓝色发光,并取得了52%的PLQY及49 nm的FWHM。最终以此量子点为发光源构筑了结构为ITO/PEDOT∶PSS/TFB/QDs/ZnMgO/Al的QLED器件,最大发光强度达到1 162 cd/m2,EQE为1.4%[36]。Zhang团队使用低毒廉价的(DMA)3P替代剧毒(TMS)3P,成功合成出发光波长峰值为468 nm且FWHM仅为47 nm的纯蓝光InP/ZnS量子点,PLQY达到45%。为进一步去除表面残余的硬脂酸锌配体,继续添加S前驱体,最终生成厚ZnS包覆的InP/ZnS/ZnS双壳层量子点,稳定性增加的同时QLED器件的EQE也得到大幅提高,达到1.7%,表明合适厚度的ZnS包覆可以有效增强InP的光电性能[37]。为进一步改善PLQY并缩窄FWHM,Yang小组采用两步加热法制备出了PLQY高达96%,FWHM仅为38 nm的InP/ZnS/ZnS量子点,如图1(f~j)所示,其过程为:首先在低温下制备出粒径极小且尺寸分布均匀的InP纳米簇,较低的温度能够保证InP不会过度生长,随后开始升温并补充In和P前驱体使得InP纳米簇逐渐生长,长大后的InP核仍然具有均匀的尺寸,这对FWHM缩窄有着较大帮助,接着继续升温包覆ZnS壳层,最终制得的QLED器件的电致发光峰位在472 nm处,FWHM为43 nm[38]。图1(a) 蓝色InPESC@ZnS量子点合成过程示意图;(b) InPESC@ZnS的器件结构示意图;(c) 对应的能带图;(d) 器件的电流密度-电压-亮度曲线;(e) 工作电压增加时QLED的发光光谱[36];(f) 蓝色InP/ZnS/ZnS量子点合成示意图;(g) QLED能带图;(h) InP/ZnS/ZnS QD薄膜二次电子截止区和价带边缘区的UPS谱;(i) 归一化的PL光谱和EL光谱;(j) 电流密度和亮度随驱动电压变化特性[38]。Fig.1(a) Schematic illustration of synthetic procedure of blue InPESC@ZnS QDs;(b) Schematic of the InPESC@ZnS device structure;(c) Corresponding energy band diagram;(d) Current density-voltage-luminance curves of the device;(e) EL spectra of a QLED at increasing operating voltages[36];(f) Schematic illustration of the synthesis of blue InP/ZnS/ZnS QDs;(g) Energy-band diagram of the QLED;(h) UPS spectra of secondary-electron cut-off regions and valence band edge regions for InP/ZnS/ZnS QD films;(i) Normalized EL and PL spectra;(j) Current density and luminance versus driving voltage characteristics[38].利用卤素离子或金属离子也可以调控InP的成核及生长速率,进而获得尺寸理想的蓝光InP量子点。Huang等人通过引入铜离子来辅助合成小尺寸InP量子点,如图2(a)所示。铜离子与磷前驱体结合生成一种六方纳米晶Cu3-xP,从而达到与In离子竞争成核并抑制InP生长的目的,最终得到了发光波长为425 nm的InP/ZnS量子点[39]。Shen等人探究了InP的发光波长与溶液中碘离子和铟离子比例之间的关系,碘离子来自于先前加入的碘化锌前驱体,作为卤素离子,碘与溶液中的胺结合形成钝化剂吸附在InP量子点表面,进而抑制InP的过量生长,通过优化合适的I/In比例从而介导小尺寸InP量子点的形成,并连续多次包覆ZnS壳,得到了尺寸分布均匀、表面缺陷少且环境稳定性较高的蓝光InP/ZnS量子点,FWHM仅为44 nm,绝对PLQY高达76%。以此量子点制作了具有倒置结构的QLED器件,其中ITO作为阴极,CBP&MoO3复合材料作为空穴注入层和空穴传输层,该器件的电致发光峰在488 nm处,FWHM为45 nm,但最大电致发光强度仅有90 cd/m2[30]。图2(a) Cu辅助法制备蓝色InP/ZnS量子点示意图[39];(b) InP/ZnS/ZnS量子点合成原理图;(c) QLED器件能带图;(d) 归一化的PL光谱和EL光谱;(e)电流密度-电压-亮度曲线;(f) 外量子效率-电流密度曲线[40]。Fig.2(a) Schematic synthesis of blue-emitting InP/ZnS QDs with Cu-assisted process[39];(b) Schematic illustration for the synthesis of InP/ZnS/ZnS quantum dots;(c) Energy band diagram of the quantum dot light-emitting diodes;(d) Normalized PL and EL spectra;(e) Current density-voltage-luminance curves;(f) EQE-Current density curves[40].Br离子有着比I离子更好的表面钝化能力,能够改善InP的表面缺陷,但通常在反应中途引入Br离子会导致水、氧进入反应体系中造成量子点PLQY的急剧下降。基于此,Zhang团队直接在反应初期引入Br离子,如图2(b~f)所示,使用ZnBr2替代ZnI2作为包壳的锌前驱体,合成出了Br离子钝化的量子点,同时Br离子有着比I离子更大的电负性,因此Br离子与量子点外表面的Zn离子结合的更加紧密,能够更有效地钝化表面Zn空位缺陷,减少电荷捕获效应,大幅提高PLQY,最终得到了发光波长为474 nm,PLQY高达93%的双壳层InP/ZnS/ZnS量子点,以该量子点制成的QLED器件具有2.9%的EQE[40]。在InP量子点表面包覆合适厚度的ZnS壳层,不仅能够提高InP量子点的PLQY和环境稳定性,还可以抑制小尺寸量子点间非辐射荧光共振能量转移现象。然而InP和ZnS二者之间存在较大的晶格失配(InP与ZnS之间的晶格失配约为7.85%),原因在于InP的晶体结构为闪锌矿型,晶格常数为0.586 nm,虽然ZnS同样是闪锌矿型晶体结构,但晶格常数为0.541 nm,二者之间相差较大的晶格常数导致晶格失配过大,此外,包覆过厚的ZnS壳层可能会导致InP内部晶格坍塌,进一步恶化晶格失配现象,同时在核壳界面处产生界面缺陷,造成光电激活能量损失,影响发光效率[41-42]。为减小晶格失配、降低界面缺陷对发光效率造成的影响,研究人员尝试构建InP基多壳层结构量子点[43]。InP作为发光核心,ZnS由于具有较宽的带隙和优异的稳定性被用作外壳层,中间层通常使用GaP。由于GaP也是闪锌矿型晶体结构,且晶格常数介于InP和ZnS之间,为0.544 nm,因此能够起到减小晶格失配(InP与GaP之间晶格失配约为6.8%)、提高发光效率的作用。Park等人通过在合成过程中加入十二硫醇(DDT)以控制InP量子点的生长尺寸,获得了具有最大50% PLQY的蓝光InP/GaP/ZnS量子点[42]。Zhang等人采用“低温成核,高温生长”法制备了厚壳层InP/GaP/ZnS蓝光量子点,如图3(a~c)所示,该量子点有着超高的环境稳定性和81%的PLQY,同时发现InP/GaP/ZnS量子点的PL光谱对称性要比无GaP内壳的InP/ZnS量子点更好,这与InP/ZnS界面处的界面缺陷减少有关,GaP桥接层的加入使得相邻层之间的晶格常数更加平衡,制成的QLED器件亮度达到3 120 cd/m2[9]。Lee课题组通过改变烷硫醇和脂肪酸中烃链长度来控制ZnS壳的反应动力学,合成出小尺寸的InP核,如图3(d~h)所示。具有短烃链的烷硫醇迅速形成ZnS壳并阻止InP核的生长,进而合成出小尺寸的InP核。此外,改变脂肪酸中烃链长度可以降低InP核成核动力学,从而获得短波长发射的量子点。所制备InP/GaP/ZnS量子点的光致发光峰为485 nm,FWHM为52 nm,PLQY达到45%,以该量子点作为发光层制备的蓝光QLED器件峰值亮度为1 045 cd/m2[44]。图3(a) InP、GaP和ZnS的能级以及它们之间的晶格失配及InP/GaP/ZnS//ZnS量子点的合成过程;(b) QLED各层材料能带图;(c) 器件在不同电压下的电致发光光谱和高亮度发光[9];(d) InP/GaP/ZnS反应示意图(上图),每个反应步骤的预期量子点结构(下图);(e) InP/GaP/ZnS/多层全溶液处理量子发光二极管示意图;(f) 归一化的PL光谱与EL光谱;(g) 电流密度-电压-亮度曲线;(h) 电流效率-外量子效率与电流密度之间的函数关系[44]。Fig.3(a) Energy levels of InP, GaP and ZnS, and the lattice mismatch values between them and schematic diagram of the synthesis process of InP/GaP/ZnS//ZnS with thick shell structure; (b) Energy level illustration for each layer materials of QLEDs;(c) EL spectra and highly bright EL emission from one emitting spot of devices at different voltages[9]; (d) Schematic of InP/GaP/ZnS reaction scheme presented in the top panel, the expected quantum dot structure at each reaction step is shown in the panel below; (e) Schematic of the InP/GaP/ZnS multilayered all-solution processed QLED;(f) Normalized PL and EL spectra;(g) Current density-voltage-luminance characteristics;(h) Current efficiency and external quantum efficiency as a function of the current density [44].除了针对InP核尺寸及包覆壳层的优化外,研究人员还对合金化结构的蓝光InP量子点进行了尝试。Zhou课题组在合成InP量子点过程中,以高活性Zn(ClO4)2作为Zn前驱体,将Zn离子掺进InP核内形成In(Zn)P合金量子点。Zn掺入后能够增大InP的带隙,从而产生蓝光发射,并且随着掺杂量的改变,发光波长也随之变化,得到的In(Zn)P/ZnS量子点具有466 nm的准蓝光发射且FWHM仅有41 nm[45]。此外,Ga离子的掺杂也得到了研究,Kim团队向合成的InP中加入GaI3得到InGaP合金量子点,通过调节GaI3的添加量控制合金化程度,在包壳时采用合金化ZnSeS作为中间层减弱InP与ZnS之间的晶格失配,制备的InGaP/ZnSeS/ZnS量子点的发光波长峰值可在465~475 nm范围内调节,最终以发光波长为465 nm量子点制作的QLED器件的EQE可达到2.5%,最大亮度为1 038 cd/m2,为蓝光InP的研究提供了新的方向","result":"深入探讨了无镉无铅型蓝光量子点材料的研究现状,特别是Ⅱ-Ⅵ族材料ZnSe和Ⅲ-Ⅴ族材料InP,这两类材料因其无毒无污染特性及优良的蓝光发射性能而备受关注。InP量子点因其可调发光波长范围宽和低毒性而成为研究的焦点,但本征带隙较窄,限制了其在蓝光领域的应用。通过优化InP核尺寸和壳层包覆,可以提高其蓝光发射性能。例如,Won等人报道的InP/ZnSe/ZnS双壳层结构红光量子点器件展示了21.4%的EQE和超过100,000 cd/m²的最大亮度。然而,InP量子点的粒径控制、低毒性磷前驱体种类有限和易氧化等问题仍需解决。\n\n研究人员通过改变合成条件和添加辅助配体来控制InP量子点的生长,如Xie等人通过调节pH和表面配体制备出水溶性InP/ZnS量子点,实现了40%的PLQY和90 nm的FWHM。Lim等人利用乙酸调控InP量子点合成过程,得到尺寸均匀的量子点,发光波长峰值为475 nm。Suh等人采用新颖的ZnS包壳方式,制备出粒径仅为1.8 nm的InP核,实现了483 nm的天蓝色发光和52%的PLQY。Zhang团队使用低毒的(DMA)3P替代(TMS)3P,合成出发光波长峰值为468 nm的纯蓝光InP/ZnS量子点,PLQY达到45%。\n\n此外,利用卤素离子或金属离子调控InP的成核及生长速率也是合成蓝光InP量子点的有效方法。例如,Huang等人通过引入铜离子辅助合成小尺寸InP量子点,得到425 nm的发光波长。Shen等人探究了I/In比例对InP量子点尺寸的影响,通过优化比例得到尺寸均匀、表面缺陷少的蓝光InP/ZnS量子点,PLQY高达76%。Zhang团队在反应初期引入Br离子,合成出Br离子钝化的量子点,PLQY高达93%,EQE达到2.9%。\n\n为了减小InP和ZnS之间的晶格失配,研究人员尝试构建InP基多壳层结构量子点。例如,Park等人通过控制InP量子点生长尺寸,得到50% PLQY的蓝光InP/GaP/ZnS量子点。Zhang等人采用“低温成核,高温生长”法制备了厚壳层InP/GaP/ZnS蓝光量子点,具有81%的PLQY和超高的环境稳定性。Lee课题组通过改变烷硫醇和脂肪酸中烃链长度控制ZnS壳的反应动力学,合成出小尺寸的InP核,得到485 nm的光致发光峰和45%的PLQY。\n\n除了核尺寸和壳层的优化,合金化结构的蓝光InP量子点也得到了研究。Zhou课题组通过掺杂Zn离子形成In(Zn)P合金量子点,实现了466 nm的准蓝光发射。Kim团队通过掺杂Ga离子得到InGaP合金量子点,发光波长峰值可在465~475 nm范围内调节,QLED器件的EQE达到2.5%,最大亮度为1,038 cd/m²。\n\n总之,详细介绍了InP量子点在蓝光QLED领域的研究进展,包括核尺寸优化、壳层包覆、卤素离子或金属离子调控、多壳层结构构建以及合金化结构的探索,为实现无毒无污染的高质量蓝光发射和QLED产业化提供了宝贵的信息和启示。","language":"zh"},{"title":"面向量子点电致发光二极管的蓝光InP和ZnSe量子点研究现状","chapter":"3 总结与展望","content":"量子点发光二极管在显示领域表现出巨大潜力及应用价值,历经数年发展,处于劣势的蓝光QLED在某些方面已经取得了相当大的进展,与主流的红、绿光QLED之间的差距正在不断缩小,并开始逐步从重金属有毒材料向环保型无毒材料转变。同时应注意到,作为“后起之秀”,人们对QLED寄予厚望,尽管其在色域、色准、发光强度及制造成本等方面具有优势,但目前仍然难以撼动OLED和LCD在显示领域的地位,离QLED商业化应用还有较长的路要走。考虑到蓝光QLED作为限制QLED发展和应用的主要因素,尤其是在当今环保和健康成为社会主旋律的条件下,对蓝光QLED材料提出了更高的要求。InP和ZnSe量子点蓝光发射性能的提高主要是通过掺杂离子或包覆合适的半导体量子点壳层等辅助手段来实现的。量子点表面态是影响其发光性能的重要因素,纳米级别的量子点有着极高的比表面积,极易产生大量表面缺陷导致发光效率降低,因此改善蓝光量子点表面质量、减少表面有害缺陷是增强光电性能的重要手段。蓝光QLED器件中非平衡态的电荷传输也是影响蓝光QLED性能的关键因素之一。蓝光量子点通常具有较深的价带能级,导致空穴传输层和发光层之间存在较大的注入势垒,严重阻碍空穴的正常注入和传输,最终发光层中的电子数量比空穴多。这种非平衡的电子与空穴传输现象会导致激子“充电”,即激子带上多余的电子,加剧了非辐射俄歇复合现象产生,使得激发能量以热量的形式释放,而不是产生光子发射,降低了器件的发光效率和寿命。精准控制电子和空穴的注入、传输、复合以及辐射跃迁等阶段能够有效提高QLED器件的光电效率和工作稳定性。此外,寻找高质量蓝光发射量子点材料是实现高效率和高性能蓝光QLED的关键所在,而蓝光量子点发光材料大都是宽禁带半导体,其材料的可选择性不如红、绿光材料那么丰富,限制了蓝光QLED的进一步发展。对InP和ZnSe来说,如何改进实验方案、进一步优化合成条件以获得尺寸均一的高质量蓝光量子点材料仍是目前亟需解决的问题。","result":"量子点发光二极管(QLED)在显示领域具有巨大潜力,蓝光QLED取得显著进展,正从有毒材料向环保型无毒材料转变。尽管QLED在色域、色准、发光强度及成本等方面具有优势,但与OLED和LCD相比,商业化应用仍有距离。蓝光QLED材料面临更高要求,InP和ZnSe量子点通过掺杂离子或包覆半导体壳层提高性能。改善量子点表面质量、减少缺陷是增强光电性能的关键。非平衡态电荷传输影响蓝光QLED性能,需精准控制电子和空穴的注入、传输、复合及辐射跃迁。寻找高质量蓝光发射量子点材料是实现高效率和高性能蓝光QLED的关键,而蓝光量子点材料选择性有限,限制了其发展。改进实验方案、优化合成条件以获得尺寸均一的高质量蓝光量子点材料是当前亟需解决的问题。","language":"zh"}]
      杨书淇,刘方海,陈萍,陈雷
      2023, 38(12): 1631-1644. DOI: 10.37188/CJLCD.2023-0299
      摘要:作为传统显示器强有力的竞争者之一,量子点发光二极管(QLED)在显示领域备受关注。然而,高性能蓝光QLED器件的发光材料中通常含有镉或铅,这两类重金属有毒元素对人体健康和生态环境不利,也阻碍了QLED器件的规模化商用进程。因此,高质量无镉无铅型蓝光量子点材料的研发成为推动新型显示产业发展的动力和业界迫切追求的目标。历经数十年发展,InP和ZnSe等无镉无铅量子点材料的蓝光发射性能已取得较大进步,随着合成策略及蓝光材料的进一步优化改进,环境友好型蓝光量子点发光二极管器件性能有望追上传统红、绿光量子点器件的步伐。本文分别从合成优化手段、表面包覆策略、核壳结构类型、发光性能参数等方面进行汇总,系统综述了当前无镉无铅型蓝光InP和ZnSe量子点材料的研究进展,指出了QLED蓝光材料未来的发展方向。  
      关键词:量子点发光二极管;蓝光量子点;电致发光;ZnSe;InP   
      272
      |
      115
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43069037 false
      发布时间:2024-07-28
    • [{"title":"手性掺杂聚合物稳定VA液晶的光学性能","chapter":"1 引 言","content":"聚合物及可聚合液晶单体在液晶相关领域中被广泛研究和应用[1-3]。聚合物稳定垂直取向(Polymer Stability Vertical alignment,PSVA)[4-5]技术通过在液晶材料中加入少量的可聚合单体,经紫外光固化在面板内表面生成聚合物层,产生预倾角,是一种非接触式的配向方式。PSVA最早由富士通公司报道[3],由默克公司与友达光电联合开发,应用于量产,随后,三星电子、肯特州立大学等诸多机构对PSVA的工艺条件开展了广泛研究[6-7]。与其他显示模式[8-9]相比,PSVA液晶显示器具有高对比度、高透过率、响应速度快、产率高及制程引入污染少等优点[10-12],在各种显示需求中被广泛应用。透过率是显示器件的重要参数。但随着显示器朝着更高分辨率的方向发展,液晶显示器的像素密度被设计得越来越高,开口率下降,影响面板的整体透过率,因此液晶显示器对透过率的提升有了更迫切的需求。研究者们对如何提升各类液晶显示器的透过率展开了广泛研究[13-14],关于PSVA显示器的性能研究也屡见报道[15-16],其中包含手性掺杂对PSVA模式显示的影响,提出了手性掺杂聚合物稳定垂直取向(Chiral Polymer Stability Vertical Alignment, C-PSVA)液晶显示模式[17]。PSVA显示模式通过“鱼骨”电极设计[4-5]实现多畴配向,同一个像素内可形成不同的配向方向。在不同区域交界处,由于其左右两侧液晶分子指向不同,液晶分子排列处于“向错”状态,使该处液晶的折射率无法得到有效利用,形成透过率很低的“黑线”,降低了PSVA显示模式的透过率。为提升PSVA显示模式的透过率,不同配向区域交界处的“黑线”是本文研究的重点。提升交界处的透过率,将有效改善PSVA显示模式开口率低的问题,提升整体透过率。C-PSVA显示模式在液晶中加入手性剂,液晶加电后形成螺旋排列,能够显著改善交界处的相错问题。本文从模拟出发,验证了C-PSVA显示模式的影响因素,得到了该显示模式需要的最佳液晶参数。根据模拟结果制作C-PSVA液晶显示样品,对该显示模式的实际显示效果进行了验证。","result":"介绍了聚合物稳定垂直取向(PSVA)技术及其在液晶显示器中的应用,强调了PSVA显示器的高对比度、高透过率等优点。同时指出了随着显示器分辨率提高,像素密度增加导致开口率下降,影响整体透过率的问题。手性掺杂聚合物稳定垂直取向(C-PSVA)显示模式通过加入手性剂改善了PSVA模式中不同配向区域交界处的“黑线”问题,从而提升透过率。本文通过模拟研究了C-PSVA模式的影响因素,得到了最佳液晶参数,并制作样品验证了显示效果。","language":"zh"},{"title":"手性掺杂聚合物稳定VA液晶的光学性能","chapter":"2 模型建立与实验条件","content":"本文中模拟及测试所使用的液晶(江苏和成显示科技有限公司,HCCH)参数如表1所示,如无特别说明,文中所列液晶折射率参数均为589 nm光源下的测试结果。液晶中所加入的可聚合单体为T1567(HCCH),具体结构如图1所示,可聚合单体在液晶中的添加比例为0.3%。所掺杂的手性剂均为T1619(HCCH),具体结构式如图2所示。表1液晶参数Tab.1Liquid crystal parameters图1T1567可聚合单体结构Fig.1Structure of polymer monomer T1567图2T1619手性剂结构Fig.2Structure of chiral monomer T16192.1 模型建立——单畴手性掺杂模型为确认手性剂的加入对液晶排列产生的影响,使用LCD Master 1D模拟软件(Shintech)建立单一配向模型,对加入手性剂后的液晶排列的变化进行验证。具体模型设置参数如表2所示。该模型可以模拟手性掺杂对液晶排列的影响,以及偏光片角度设计对光学的影响。表2C-PSVA显示模式1D模型参数Tab.21D model parameters of C-PSVA2.2 模型建立——多畴相错模型PSVA显示模式相邻两个区域液晶的配向方向相差90°。使用LCD Master 2D液晶模拟软件(Shintech)建立模型,模型示意图如图3所示。对该模型左右区域进行不同的参数设定,分别设定配向角度为45°和135°,扭曲角都为 0°,预倾角都为88°,螺距、盒厚和液晶折射率皆为变量。图3PSVA LCD Master 2D模型示意图Fig.3PSVA model of LCD Master 2D该模型可以得到液晶盒透过率随液晶排列状态的变化,得到C-PSVA显示模式的光电特征曲线及透过率随位置的分布曲线,可以直观了解透过率改善效果。2.3 实际效果验证根据模拟得到的结果,分别按照C-PSVA和PSVA显示模式对应的最佳延迟量和手性剂掺杂比例设计配方,制备液晶。利用毛细作用力将液晶注入到盒厚为3.2 μm的测试盒中。测试盒像素为四畴结构,其中一侧电极设计如图4所示,另一侧为整面电极。加电后,液晶分子会向不同方向倾倒。对装好液晶的测试盒进行配向处理,具体步骤为:图4PSVA多畴电极结构Fig.4Structure of PSVA multi-domain(1)使用0~15 V的步进方波电压(60 Hz)对液晶盒加电,最终保持15 V,使液晶分子缓慢倾倒;(2)使用照度为5.5 mW/cm2(波长313 nm)的紫外光对液晶盒进行80 s的照射,使得可聚合单体在液晶盒内表面固化,形成预倾角;(3)撤掉电压,使用照度为0.25 mW/cm2的紫外光(波长313 nm)对液晶盒进行90 min的照射处理,反应掉剩余的可聚合单体,完成配向。对配向完成的液晶盒进行实际效果验证:对测试盒施加10 V、60 Hz方波电压,在偏光显微镜(LEICA DM2700M)下观察,确认多畴交界处“黑线”位置的透过率改善效果。使用OPTIPRO-micro 位相差测定设备(Shintech)的光电功能测试液晶盒的V-T曲线,对比确认C-PSVA显示模式对透过率的实际提升效果,测试条件为:电压范围0~9 V,电压步径0.1 V,测试波形方波,频率60 Hz,测试镜头直径150 μm。","result":"介绍了手性掺杂聚合物稳定VA液晶的光学性能研究。使用HCCH液晶和T1567可聚合单体,加入0.3%的T1619手性剂。通过LCD Master 1D和2D模拟软件建立单畴和多畴相错模型,模拟手性掺杂对液晶排列和光学特性的影响。实验中,将液晶注入3.2 μm盒厚的测试盒,采用毛细作用力和紫外光固化技术制备多畴结构。通过偏光显微镜和光电功能测试设备,验证了C-PSVA显示模式对透过率的实际提升效果。","language":"zh"},{"title":"手性掺杂聚合物稳定VA液晶的光学性能","chapter":"3 结果与讨论","content":"3.1 手性剂比例对液晶排列的影响采用单畴手性掺杂模型,将液晶HAV653341的螺距分别设置为1倍、2倍、4倍的盒厚,相当于加入不同比例的手性剂,对应的扭曲角度分别是360°、180°和90°。模拟结果显示,未加电时,在3种手性剂比例下,液晶均可以按照正常的VA模式进行排列,不会发生扭曲。加电后,液晶分子发生扭曲,并且扭曲的角度与螺距值所对应的角度基本一致,如图5所示。图5手性剂对液晶排列的影响Fig.5Effect of chiral monomer on LC alignment3.2 偏光片角度对液晶透过率的影响采用单畴手性掺杂模型,将液晶HAV653341的螺距值设置为4倍的盒厚,模拟不同偏光片角度下液晶盒的光电曲线,模拟结果如图6所示。从图6中可以看出,偏光片角度为45°~135°时液晶盒的透过率远高于偏光片角度为0°~90°时的透过率,传统PSVA显示模式0°~90°的偏光片组合并不适用于液晶中有手性掺杂的情况。C-PSVA显示模式中液晶存在扭曲,类似于TN显示模式,所搭配的偏光片角度需进行相应的调整。图6偏光片角度对透过率的影响Fig.6Influence of polarizer angle on transmittance3.3 手性剂比例对液晶透过率的影响使用图3中建立的LCD Master 2D模型对C-PSVA显示模式的透过率情况进行模拟,具体模型设置条件如表3所示,将液晶盒的盒厚设定为3.4 μm。对表1所示的两款液晶进行模拟。分别模拟了加入不同比例的手性剂,使液晶的螺距值为3倍、4倍、8倍的盒厚,以及不加入手性剂时,液晶盒的透过率随电压变化的情况及液晶盒不同位置对应的透过率分布情况,结果如图7所示。图7手性剂比例对C-PSVA透过率的影响Fig.7Effect of chiral monomer ratio on the transmittance of C-PSVA由图7(a)、图7(c)可以看出,随着手性剂的加入,两款液晶盒整体的透过率都有所提升,并且在螺距值为4倍的盒厚时,透过率达到最大值。由图7(b)、图7(d)可以看出,同一电压下,液晶盒不同位置的透过率会随着手性剂的加入发生变化,尤其是两个不同配向区域的交界位置。未加入手性剂时,该处的透过率基本为0,随着手性剂的加入,该处透过率提升,并且在螺距值为4倍的盒厚时,透过率提升最明显。另外,将两款液晶的透过率提升情况进行对比,发现HAV674641在加入手性剂后对透过率的提升更加明显,说明C-PSVA显示模式对透过率的改善效果和液晶的折射率有关。进一步分析加电后C-PSVA显示模式的液晶排列情况,如图8所示。未加入手性剂时,由于两个相邻区域的配向方向不同,外电场作用下,不同配向方向区域的液晶向不同方向倒下,交界处的液晶产生相错,折射率不能有效利用。由于下偏光片相互正交,所以加电后该区域的透过率很低。随着手性剂的加入,液晶在电场作用下倒下时,不同位置的液晶都呈现螺旋状排列,产生旋光效应,所以两个区域交界处的透过率会有大幅提升。而两个配向区域部分,因液晶的排列方式较传统PSVA显示模式有所改变,影响了光的传播,所以此处的透过率也发生了变化。图8手性剂的加入对液晶排列的影响Fig.8Effect of chiral monomer on the LC direction3.4 延迟量对透过率的影响通过3.3节的模拟发现,在液晶中掺杂手性剂后,不同折射率的液晶透过率提升程度有差异。因此对C-PSVA显示模式的最佳延迟量进行验证。3.4.1 固定折射率,改变盒厚我们选用表1所示的液晶HAV674641对不同盒厚的C-PSVA显示模式进行模拟,得到透过率曲线如图9所示。传统PSVA显示模式的最佳延迟量约为340 nm,模拟所选用的2.6 μm盒厚搭配液晶HAV674641,对应传统PSVA显示模式的最佳延迟量。从模拟结果可以看出,C-PSVA显示模式在盒厚为2.6 μm时,透过率远低于盒厚为3.0 μm和3.4 μm时的透过率,说明C-PSVA显示模式的透过率改善效果除了与折射率有关外,还与液晶盒的盒厚有关,即C-PSVA显示模式的最佳延迟量与传统PSVA显示模式最佳延迟量不同。具体C-PSVA显示模式对应的最佳延迟量,通过固定盒厚、改变折射率的方式进一步验证。图9盒厚对C-PSVA显示模式透过率的影响Fig.9Effect of cell gap on the C-PSVA transmittance3.4.2 固定盒厚,改变折射率固定液晶盒的盒厚为3.4 μm,设置液晶的螺距值为13.6 μm,即螺距值为4倍的盒厚。将液晶的折射率设置为变量,其余液晶参数同表1液晶HAV674641,模拟不同延迟量条件下液晶盒的透过率随电压变化的情况,模拟得到的结果如图10所示。由模拟结果可以看出,当液晶Δn在0.13~0.14之间时,透过率达到了最大值。图103.4 μm盒厚折射率对V-T曲线的影响Fig.10Effect of refractive index on V-T curves at 3.4 μm gap进一步固定液晶盒的盒厚为3.0 μm,设置液晶的螺距值为12 μm,即螺距值为4倍的盒厚。将液晶的折射率设置为变量,其余液晶参数同表1液晶HAV674641,模拟不同延迟量条件下,液晶盒的透过率随电压变化的情况,模拟得到的结果如图11所示。由模拟结果可以看出,当液晶Δn在0.15~0.16之间时,透过率达到了最大值。固定螺距值为4倍的盒厚,在不同的延迟量条件下,液晶盒的透过率不同,C-PSVA模式的最佳延迟量约为460 nm。图113.0 μm盒厚折射率对V-T曲线的影响Fig.11Effect of refractive index on V-T curves at 3.0 μm gap3.5 实测结果根据以上模拟结果,使用3.2 μm的测试盒对PSVA和C-PSVA两种显示模式的实际效果进行对比。其中PSVA显示模式的最佳延迟量约为340 nm,选用Δn为0.109的HAV635496进行实验;C-PSVA的最佳延迟量约为460 nm,配制Δn为0.145的PV016-001进行实验。两种液晶的具体参数如表1所示。在液晶中加入不同比例的手性剂,如表4所示,其中HAV635496中未添加手性剂,PV016-001添加手性剂后的液晶螺距符合C-PSVA显示模式的最佳螺距值。表4PSVA和C-PSVA液晶手性剂含量Tab.4Chiral monomer ratio of PSVA and C-PSVA LC将配制好的2款液晶分别装入盒厚为3.2 μm的鱼骨盒中,进行加电UV配向,制备好测试样品。3.5.1 显微镜观察将两款液晶盒依次放到偏光显微镜下进行观察,如图12所示。可以看出,C-PSVA显示模式的透过率较PSVA显示模式有所提升,尤其是多畴交界位置,亮度提升明显,C-PSVA显示模式可以很好地改善不同配向方向交界区域的黑线问题,实测结果与模拟结果一致。图12液晶盒显微观察结果Fig.12Microscopic observation results of the cell3.5.2 光电曲线测试使用光电测试设备对两款液晶盒进行V-T测试,测试结果如图13所示。由测试结果可以看出,与传统PSVA显示模式对比,C-PSVA显示模式的透过率约有13%的提升。图13C-PSVA与PSVA样品V-T曲线对比Fig.13V-T curves of C-PSVA and PSVA cells","result":"通过模拟和实验研究了手性掺杂聚合物稳定VA(C-PSVA)液晶的光学性能。研究发现,手性剂比例对液晶排列有显著影响,不同比例的手性剂加入后,液晶分子在加电时的扭曲角度与螺距值对应。偏光片角度对液晶透过率有重要影响,45°至135°的偏光片角度下透过率更高,表明传统PSVA模式的偏光片组合不适用于手性掺杂液晶。手性剂比例的增加提升了液晶盒的整体透过率,尤其在螺距值为4倍盒厚时达到最大,且不同位置的透过率会随着手性剂的加入而变化。延迟量对透过率也有影响,C-PSVA模式的最佳延迟量与传统PSVA模式不同,与折射率和盒厚有关。实验结果显示,C-PSVA模式的透过率比PSVA模式提高了约13%,且在多畴交界位置亮度提升明显,有效改善了黑线问题。","language":"zh"},{"title":"手性掺杂聚合物稳定VA液晶的光学性能","chapter":"4 结 论","content":"为提升PSVA显示器件的透过率,本文研究了一种新的显示模式C-PSVA,建立合适的模型通过模拟软件对C-PSVA的显示效果进行验证,并对其显示原理进行分析说明。研究了偏光片角度、延迟量和手性剂含量对显示效果的影响,得到了该显示模式的最佳延迟量约为460 nm,最佳手性剂含量对应的螺距值为4倍的盒厚。根据模拟结果配制液晶,装入鱼骨盒中对C-PSVA的实际显示效果进行验证。实验结果表明,C-PSVA与传统的PSVA显示模式相比,透过率可以提升约13%,不同配向方向交界位置的透过率改善明显,整体亮度均匀。","result":"介绍了C-PSVA显示模式对提升PSVA显示器件透过率的研究,通过模拟软件验证了显示效果,并分析了影响因素。确定了最佳延迟量和手性剂含量,实验验证了C-PSVA与传统PSVA相比,透过率提升约13%,亮度均匀性改善。","language":"zh"}]
      丁文全,王力娜,杨亚非,王盼盼,周振婷,李荣荣
      2023, 38(12): 1645-1652. DOI: 10.37188/CJLCD.2023-0306
      摘要:聚合物稳定VA(PSVA)液晶显示模式具有优异的光电性能。为进一步提升PSVA显示模式的透过率,在液晶中加入手性剂,形成手性掺杂聚合物稳定VA(C-PSVA)液晶显示模式。本文对C-PSVA显示模式的最优参数及实际显示效果进行研究。首先,建立模型对C-PSVA显示模式的光电特性及液晶分布进行模拟,分析了手性剂的加入对液晶排列产生的影响,对C-PSVA的显示原理进行分析。其次,研究了C-PSVA显示模式的延迟量、偏光片角度、手性剂比例对透过率提升的影响。最后,按照模拟结果配制液晶,制作C-PSVA样品,进行实际效果验证。结果表明,C-PSVA显示模拟的透过率较PSVA显示模式有明显提升,C-PSVA显示模式最佳延迟量约为460 nm,最优手性剂含量对应螺距值为4倍的盒厚。实测结果显示,与PSVA显示模式相比,C-PSVA显示模式透过率约有13%的提升。  
      关键词:聚合物稳定;手性剂;透过率;最佳延迟量   
      197
      |
      94
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43069075 false
      发布时间:2024-07-28

      器件物理及器件制备

    • [{"title":"用于宽色域液晶显示器的反射型高光效率彩色滤光片","chapter":"1 引言","content":"光效率和色域是显示设备中极为重要的参数。光效率的高低直接影响着在相同背光强度下画面的亮度和能耗。较高的光效率意味着显示屏能够呈现更高的亮度,提高色彩的鲜艳程度,或者以较低的功耗提供背光强度,从而降低显示器的能耗。随着显示画面的真实度要求不断提高,宽色域显示器件越来越受欢迎。从显示原理来看,背光源和彩色滤光片的性能共同决定了显示器件的色域上限。色域大小表示显示设备所能展现的颜色范围的大小,直接关系到画面的色彩丰富度和真实性。色域大小以色度图中覆盖面积与某个标准色域的比值来表示。常见的色域标准包括NTSC、sRGB、DCI-P3和Rec.2020等,其中,NTSC标准被广泛应用于显示器的色域描述[1-3]。普通的LCD使用黄色荧光粉转换白光发光二极管,具有非常高的亮度表现和低功耗,但色域不高[4-5]。宽色域LCD通常使用量子点背光来实现,镉基量子点发光二极管可以实现110% NTSC的色域,钙钛矿量子点发光二极管则可达到120% NTSC的色域[6-9]。然而,这两种技术中存在重金属而受到管制[10]。光学滤波器可以精确控制透过光谱,可以有效提高液晶显示器的色域。基于法布里帕罗腔的滤波器和宽色域彩色滤光片的组合使用,可以实现127% NTSC的色域[11]。应用多层介质膜结构的干涉滤波器可以获得112.2% NTSC的色域[12]。双折射滤波器也是一种可行方案,可有效抑制杂光并获得126% NTSC的色域[13-14]。需要注意的是:液晶显示器的色域提升往往伴随着光效率的下降,原因是将背光光谱变为宽色域所需要的光谱时,需要滤掉不需要波长光或降低它们的透过率。如何在保证宽色域的前提下提升光效率是一个棘手的问题。在传统液晶显示器中,影响光效率的主要因素有:起偏器的透过率、薄膜晶体管(TFT)阵列的开口率和彩色滤光片(CF)的透过率。起偏器的透过率不超过50%,TFT阵列开口率约为60%,彩色滤光片的光效率低于1/3,再考虑光路中其他位置的光损失,传统液晶显示器的光效率通常在5%左右[15]。采用双亮度增强膜,可以有效解决起偏器吸收光的问题,光效率有了明显提升。随着技术发展和像素结构设计优化,TFT阵列开口率也得到了大幅提升。然而,彩色滤光片的光效率低的问题依然没有解决。高效地实现空间分色或时间分色是获得高光效率的基础。传统的彩色滤光片需要吸收非目标颜色的光,导致至少2/3的光被浪费,因此光效率很低。场序彩色法是一种高效的时间分色方法,按照时间顺序来透射红、绿、蓝3种颜色的光,并利用人眼的视觉惰性,实现逼真的色彩显示[16]。场序彩色法的光效率虽然非常高,但在快速动态图像显示中会出现严重的色彩分离现象,尽管可以通过提高刷新频率来极大降低色彩分离问题,但需要更严格的驱动技术和显示器件技术[17]。利用光栅分光效应来实现空间分色,也是一种高效的方法。其中,塔尔博特光栅是一种常见的分色光栅。基于塔尔博特效应,当白光照射到光栅上时,可以产生彩色的干涉图案,将其他像素点上的光聚焦到一个像素点上[18]。然而,由于塔尔博特距离的波长依赖性,实际上色彩分离平面并不完全重合,这限制了其在液晶显示器中的应用。在液晶显示器件研究中,追求宽色域的同时,提升液晶显示器的光效率仍然是一个极具挑战的问题。本文根据薄膜干涉原理,提出了通过调控薄膜厚度构建的彩色滤光片。单色滤光片可以透过某种单色光,而反射其他颜色的光,反射的光被反射板反射后再次被其他单色滤光片利用,从而提高光效率。我们模拟计算了带有黄色荧光粉的白光二极管背光单元和量子点背光单元的色域和光效率,这种彩色滤光片可以同时实现色域和光效率的提升,结果将为提升液晶显示器的色域和光效率提供有效的解决方案。","result":"讨论了光效率和色域在显示设备中的重要性,指出高光效率可以提高画面亮度、降低能耗,而宽色域显示器件越来越受欢迎。分析了背光源和彩色滤光片对色域的影响,以及不同背光技术如量子点背光的色域表现。指出提升色域往往导致光效率下降的问题,并分析了影响光效率的主要因素。探讨了提高光效率的方法,如双亮度增强膜、场序彩色法和塔尔博特光栅等。最后,提出了基于薄膜干涉原理的彩色滤光片设计,通过调控薄膜厚度实现高光效率和宽色域,并通过模拟计算验证了其效果。","language":"zh"},{"title":"用于宽色域液晶显示器的反射型高光效率彩色滤光片","chapter":"2 实验基础和理论分析","content":"如图1所示的实验结构中,由反射式滤光片构成的红绿蓝阵列在有背光源情况下,表现出非常强的红绿蓝表现,测量得到背光源的发射光谱和三色的出射光强如图2(a)所示,单色的出射光谱中有部分波长处的出射光强大于背光源的光强。图1背光源(a)关态和(b)开态下的反射滤光片阵列Fig.1Reflective color filter array with backlight under (a) off state, and (b) on state.图2三基色的(a)光强和(b)透过率Fig.2(a) Light intensity and (b) transmittance of the three primary colors考虑反射滤光片特点,某单色滤光片透射某波段范围内的光而反射其他波长的光,反射光经过背光源中的反射膜再反射回来,反射光路中被折射或散射到其他单色滤光片处出射。理想情况下,可以实现背光照射到3个滤光片处的某单色光经过多次反射后集中到一个滤光片处出射,从而得到每个单色滤光片处的出射光强高于背光源在此滤光片透射波带的光强。将单色滤光片透射光强分别除以原背光源的光强,得到图2(b)的透过率结果。可以看到,红色、绿色和蓝色中的最大光强分别达到原光强的2倍、1.5倍和1.75倍。与传统彩色滤光片的透射某单色光而吸收其他色光相比,这种结果可以有效提高光利用效率,降低由于彩色滤光片带来的能量损失。为了研究该结构对光效率的提升作用,模型建立和理论分析都是必要的。三基色显示器的光效率采用式(1)进行计算, ,(1)其中:Ii和Io分别表示单个像素点处的入射光强和出射光强,TRGB代表红绿蓝像素的透过率,为红绿蓝3个子像素的求和,且假设3个子像素的面积相同。由式(1)可知,提高光效率本质上就是提升每个颜色像素的透过率。我们提出的反射型彩色滤光片,在每个颜色的像素点处只有相应颜色的光可以透射,其他颜色的光被反射,以红光为例,其光路如图3所示。红光在红色滤光片处直接透射,透过率为Tr,在绿色和蓝色滤光片处反射的光,被背光源的反射板反射回来,经过1次或多次反射从红色滤光片处透射。因为红绿蓝三色光具有等价性,仅需要考虑其中一种光的行为,并推导出其光效率。图3中红光的出射位置有一定的差异,但这些出射位置具有周期性,所以几个出射光可视为从同一位置出射。图3红光光路示意图,上为绿色像素位置反射红光情况,下为蓝色像素反射红光情况。Fig.3Diagram of the red light path. The top section shows the reflection of the red light by green pixels, while the bottom section shows the reflection by blue pixels.对于红光在彩色滤光片中的透过率,其形式如式(2)所示。 ,(2)其中:Tg-r代表绿色子像素对红光的贡献,Tb-r代表蓝色子像素对红光的贡献,Tr表示红光经过红色子像素的透过率。Tg-r的表达式为: ,(3)其中各项分别为: (4)其中:Rg和Rb分别代表绿色和蓝色子像素的反射率,γ为光在介质膜中传播的透过率,Tg-r(n)表示绿色子像素经过n次反射后经过红色子像素的透过率。通过观察上述表达式,经过一次反射和经过3次反射后红光的透过率仅相差一个系数;同样地,经过2次反射和4次反射也是如此。将奇数次反射和偶数次反射分别考虑,得到式(5): .(5)利用等比级数的性质,式(5)进一步化简得到式(6), (6)根据蓝色和绿色子像素的等价性得出: ,(7)其中:,与βg-r形式相同,统一记做βr,综合以上得到红光的透过率为: (8)其中,Av表示红光透过率的净增益,与透射系数的关系如图4所示。图4净增益与透射系数γ2的关系Fig.4Relationship between net gain and transmittance coefficient γ2在考虑红光的净增益时,令绿色和蓝色子像素对所需要的红光反射率为1。图4表现了在考虑的反射次数不同时,净增益的变化情况。可以看到,在同样的透射系数情况下,考虑的反射次数越多,净增益也就越大;考虑的反射次数达到5次时,已经十分接近无穷多次反射的极限情况。当γ2=0时,像素和背光反射板之间的介质层吸收了所有反射光或反射光没有被再反射利用,则净增益为0。当γ2=1时,中间介质层为理想透明,没有光吸收,红色和蓝色子像素位置处的红光全部集中到红色子像素下,净增益为2。若考虑实际情况,即使只有1次反射和约为0.8的透射系数,净增益也约为0.8。这个净增益效率对于提高光效率也是非常重要的。根据红绿蓝的对称性,得出绿色和蓝色的透过率分别为: ,(9)其中:。","result":"通过实验和理论分析,研究了反射型高光效率彩色滤光片在宽色域液晶显示器中的应用。实验中,利用反射式滤光片构成的红绿蓝阵列在背光源下表现出强的三基色表现,测量结果显示单色出射光强在部分波长处大于背光源光强。理论分析中,考虑了反射滤光片的透射和反射特性,以及光在背光源中的反射和折射行为。通过建立模型和计算公式,分析了光效率的提升作用。实验和理论结果表明,与传统彩色滤光片相比,反射型彩色滤光片可以有效提高光利用效率,降低能量损失。研究还探讨了红光在彩色滤光片中的透过率,以及净增益与透射系数的关系,为提高光效率提供了理论依据。","language":"zh"},{"title":"用于宽色域液晶显示器的反射型高光效率彩色滤光片","chapter":"3 结构设计和计算结果","content":"基于光学薄膜干涉理论,可以利用周期性叠加高低折射率材料来实现需要波长范围具有高透过和在邻近波长范围具有高反射的特性。在这种结构中,透过和反射范围的位置取决于薄膜的光学厚度。通过增加周期数,可以进一步提高反射带的反射率,但是过多的周期数会导致带通区域产生较大的波纹,甚至出现透过峰的分裂[19]。我们采用3种介质构成结构单元[ABCCBA],分别为低折射率的氟化镁(MgF2),其折射率为nA=1.38;中等折射率的氧化铪(HfO2),其折射率为nB=1.9;高折射率的二氧化钛(TiO2),其折射率为nC=2.3。为了方便描述,使用A、B和C分别代表氟化镁、氧化铪和二氧化钛。为了不在透射波长范围产生较大的波纹,将周期数设置为8,表示为[ABCCBA]8。通过精确调控各层材料的厚度和折射率,能够实现特定波长范围的高透射,其他波长范围的高反射。各层的厚度依据式(10)计算: ,(10)其中,λ0为反射率最大的波长值,彩色滤光片对于不同材料的厚度要求汇总到表1中。为了实现只透过一种颜色的光,反射另外两种颜色的光,每种颜色滤光片需要两种颜色的结构,如图5所示。通过将具有不同反射峰的高反射结构串联来实现特定的滤光效果。以红色滤光片为例,当白光入射时,经过蓝色反射膜和绿色反射膜的依次反射,只有波长大于600 nm的红光透过。这样的红色滤光片既能有效地分离出红色光,实现高纯度的红色显示;又能够反射蓝光和绿光,使它们由背光模组底部的反射膜再次反射进入相应的蓝色或绿色透光片透射,提高光的利用效率。蓝色和绿色彩色滤光片的工作原理与红色滤光片基本相同。表 1彩色滤光片中各介质层的厚度Tab.1Thickness of each medium layer in the color filter nm图5(a)红色、(b)绿色、(c)蓝色滤光片整体结构和滤光原理。Fig.5Overall structure and filtering principles of (a) red, (b) green, and (c) blue color filters.不考虑各透明介质层的吸收效应,本文计算了三基色彩色滤光片的透光特性和反射特性,如图6所示。在一般背光光谱中,低于440 nm和高于700 nm的波长成分占比非常小。因此,即使滤光片在波长400 nm和750 nm附近具有一定的透过性,也不会对滤光片的颜色纯度产生影响。在每种基色滤光片中,对另外两种基色的反射率都接近100%。图6三基色彩色滤光片的(a)透射率光谱和(b)反射率光谱Fig.6(a) Transmission and (b) reflection spectra of three primary color filters由图6(b)中的反射率,并考虑光在背光模组中由于散射和反射等原因造成的损失,令透射系数,应用式(9)计算得到红绿蓝三基色的整体透过率,如图7所示,各基色的最大透过率均大于2.0,即每种单色光都实现一倍以上的光增益。此外三基色彩色滤光片实现了对应颜色的单一性透过,实现了滤色膜的功能。对于YAG-LED和QD背光源情况,所需要的基色范围内的光强度远大于背光源自身的光强度,从而提高了显示器的光利用效率。图7(a)三基色滤光片的透过率,(b) YAG-LED和(c) QD背光的三基色透射光强。Fig.7(a) Transmittance of the three primary color filters, transmitted light intensity of the three primary colors for (b)YAG-LED and (c) QD backlight.将新型彩色滤光片与YAG-LED背光源结合使用,相比于采用宽色域彩色滤色膜,获得的三基色光谱更窄,峰值高度更高,从而可以获得出色的光效率和宽色域(32.9% NTSC,118.4% NTSC),采用宽色域彩色滤色膜的光效率和色域分别为23.4% NTSC,84.6% NTSC,如图8所示。因此,我们提出的技术在光效率和色域上都有很大的提高。图8使用YAG-LED背光,不同彩色滤光片情况下的(a)出射光强与(b)色域。Fig.8Using YAG-LED backlight, (a) the emitted light intensity and (b) color gamut with different color filters.表2给出了YAG-LED背光情况下,三基色的峰值和半高宽度。可以看到,使用反射型彩色滤光片可以显著降低三基色的半高宽度值,从而提高色彩的纯度。反射型彩色滤光片将绿色和红色的半高全宽降低到只有十几纳米,蓝色的半高宽度基本不变,从而获得了色域的提升。表 2YAG-LED下反射型彩色滤光片峰值和半高宽度Tab.2Peak value and full width at half maximum (FWHM) of the reflective color filter with YAG-LED backlight将新型彩色滤光片与量子点(QD)背光源结合使用时,透射光强光谱和色域如图9所示。在使用反射型彩色滤光片时,半高宽度值进一步降低,优于量子点背光源,同时量子点背光源三基色之间对三基色饱和度有影响的串扰光被消除,表明反射型彩色滤光片能够提供更纯的三基色,详细的峰值波长和半高宽度信息见表3。光效率和色域分别为58.9% NTSC和130.4% NTSC,相较于宽色域彩色滤色膜(26.8% NTSC,96.7% NTSC)有了很大的提升。图9使用QD背光时,不同彩膜情况下的(a)出射光强与(b)色域。Fig.9Using QD backlight, (a) the emitted light intensity and (b) color gamut with different color filters.表 3使用QD背光,反射型彩色滤光片峰值和半高宽度Tab.3Peak value and full width at half maximum (FWHM) of the reflective color filter with QD backlight由于多层膜结构的透射是干涉效应的结果,所以光学透过率与波长的关系具有角度依赖性,即滤光片的透射峰值和强度会随入射角度发生变化,如图10所示,透过率光谱随着入射角度增大而蓝移。当入射角从0°增加到10°时,彩色滤光片的中心峰值会轻微蓝移约5 nm,当入射角增加到25°时,蓝移超过10 nm。图10(a)红色、(b)绿色、(c)蓝色滤光片透射率与极角的关系。Fig.10Relationship between the transmittance of (a) red, (b) green, and (c) blue color filters and the polar angle.图11~图13给出了两种背光源情况下,不同入射角的出射光强、色域、光效率和色域随极角的变化。图11中随着极角变化,绿色光的出射峰值和光强变化明显,从而在图12的色度图中表现出绿色色度坐标变化明显。在图13中给出的光效率和色域随极角的变化图中,当入射角从0°增加到25°时,YAG-LED的显示器的光效率没有下降(32.9%变化至33.1%),这是因为YAG-LED光谱较宽,滤光片透射峰值变化,绿光光强减小而红光光强增加,整体光效率变化很小;而QD背光的光效率下降较为严重(从58.9%降至41.5%),这是因为QD背光光谱较窄,当滤光片的透射峰值发生移动时,背光光谱和滤光片的透射峰不匹配,导致绿光和红光透射光强下降明显,从而导致光效率在大极角时变化很大。两种背光源显示器的色域随着视角增大会先升高再下降。图11(a) YAG-LED、(b) QD背光在不同极角下的出射光强分布。Fig.11Light intensity distribution varied with polar angles for (a) YAG-LED and (b) QD backlight图12(a) YAG-LED和(b) QD背光的不同极角的色域Fig.12Different color gamut at different polar angles for (a) YAG-LED and (b) QD backlight图13(a) YAG-LED和(b) QD背光的光效率和色域与极角的关系Fig.13Relationship between light efficiency, color gamut, and polar angles for (a) YAG-LED and (b) QD backlight.液晶显示器背光模组中的正交亮度增强棱镜使出射光集中在20°极角范围内,背光模组最上方的扩散膜将集中的光进行混合和扩散[20-21]。可以将扩散膜放置在显示器上方,则彩色滤光片的极角依赖性可以被扩散膜减弱。如图14所示,彩色滤光片在20°极角内的平均透过率曲线与0°的透过率曲线相差不大,彩色滤光片的透射光谱蓝移5 nm以下,并且峰值下降很小,因此考虑20°极角内的平均,我们提出的彩色滤光片也具有非常好的颜色和光效率的表现。图14(a)红、(b)绿、(c)蓝彩色滤光片垂直入射和20°极角内的平均值的透过率。Fig.14Transmittance of the normal direction and average transmittance of polar angle range within 20° for (a) red, (b) green, and (c) blue color filters.图15(a)为红绿蓝三色滤光片的平均透过率光谱,图15(b)为20°极角内平均后的色域表现,图15(c)和图15(d)为YAG-LED和QD背光情况下的平均透射光谱。在YAG-LED背光条件下,可实现120.7% NTSC色域和32.9%的光效率,在量子点背光条件下,可实现131.4% NTSC色域和56.4%的光效率。图1520°极角平均后,(a)三基色滤光片的透过率、(b)两种背光源下的色域、(c) YAG-LED和(d) QD背光时的出射光强。Fig.15After averaging of polar angle range within 20°, (a) the transmittance of different primary color filters, (b) color gamut under two backlight sources, the intensity of emitted light for (c) YAG-LED and (d) QD backlight.","result":"基于光学薄膜干涉理论,通过周期性叠加不同折射率材料,设计了一种用于宽色域液晶显示器的反射型高光效率彩色滤光片。采用3种介质构成结构单元,分别为氟化镁、氧化铪和二氧化钛,周期数设置为8,以实现特定波长范围的高透射和高反射。通过精确调控各层材料的厚度和折射率,实现了只透过一种颜色的光,反射另外两种颜色的光。计算了三基色彩色滤光片的透光特性和反射特性,发现在一般背光光谱中,滤光片在波长400 nm和750 nm附近具有一定的透过性,但不会对颜色纯度产生影响。三基色彩色滤光片的反射率接近100%,实现了单一颜色的透过和滤色膜的功能。与YAG-LED和QD背光源结合使用时,新型彩色滤光片能够提高显示器的光利用效率,获得出色的光效率和宽色域。反射型彩色滤光片显著降低了三基色的半高宽度值,提高了色彩的纯度。光学透过率与波长的关系具有角度依赖性,滤光片的透射峰值和强度会随入射角度发生变化。通过在显示器上方放置扩散膜,可以减弱彩色滤光片的极角依赖性,使其在20°极角内的平均透过率与0°的透过率相差不大,保持了良好的颜色和光效率表现。在YAG-LED背光条件下,新型彩色滤光片可实现120.7% NTSC色域和32.9%的光效率;在量子点背光条件下,可实现131.4% NTSC色域和56.4%的光效率。","language":"zh"},{"title":"用于宽色域液晶显示器的反射型高光效率彩色滤光片","chapter":"4 结论","content":"本文提出了反射式彩色滤光片结构,理论上计算了反射式彩色滤光片对透过率的作用,设计了基础结构为[ABCCBA]8的三基色彩色滤光片结构,模拟计算了它们的透光特性和使用YAG-LED及QD背光的光效率和色域。考虑滤光片的视角依赖性和扩散膜的作用,对显示器进行了20°极角内的光效率和色域的平均,实现大于120% NTSC(YAG-LED)和131% NTSC(QD)的色域,光效率分别大于32%(YAG-LED)和56%(QD背光)。相比传统彩色滤色膜技术,色域得到显著提高,光效率提高50%(YAG-LED)和150%(QD)以上。更宽的色域和更高的光效率,意味着可以在较低的背光功耗下获得色彩鲜艳的显示效果。当考虑将本技术进行应用时,也需要考虑这些滤光片像素化制作上的难度和成本,将背光源的光集中在20°极角内和再进行散射形成宽视角特性过程中的问题,以及在液晶显示器中应用这些滤光片的位置和液晶器件结构造成的光效率下降问题。总之,该技术在预想应用中还存在很多问题,需要更多的研究来促进技术的发展和克服各种困难。","result":"提出了反射式彩色滤光片结构,设计了三基色彩色滤光片,模拟计算了透光特性和光效率;实现了超过120% NTSC(YAG-LED)和131% NTSC(QD)的色域,光效率分别大于32%(YAG-LED)和56%(QD背光);相比传统技术,色域和光效率显著提高;在应用中需考虑像素化制作难度、成本、光集中和散射问题,以及液晶器件结构对光效率的影响。","language":"zh"}]
      鹿文昕,赵云鹭,殷轼雯,周子涵,马红梅,孙玉宝
      2023, 38(12): 1653-1663. DOI: 10.37188/CJLCD.2023-0266
      摘要:为了提高宽色域液晶显示器的光效率,本文提出了一种反射式彩色滤光片。首先计算了反射式彩色滤光片的光效率增强效果,然后设计了基于低中高折射率介质的多层堆叠结构([ABCCBA]8)的彩色滤光片,在使用带有黄色荧光粉的白光二极管(YAG-LED)和量子点(QD)背光单元时,光效率分别从17.4%提升到32.9%,从18.5%提高到58.9%,同时该结构的色域提高到了120.7% NTSC和131.2% NTSC。考虑背光模组中散射膜的作用,计算了入射光角度在20°以内时,带有YAG-LED和QD背光的LCD光效率依然分别大于32%和56%,色域基本不变。这些结果在宽色域液晶显示器中具有重要的潜在应用前景。  
      关键词:液晶显示;光效率;宽色域;反射   
      320
      |
      139
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42811758 false
      发布时间:2024-07-28
    • [{"title":"基于液晶器件的同轴复合涡旋光束的产生及调控","chapter":"1 引言","content":"涡旋光束,也称为光学涡旋,是具有轨道角动量(OAM)的新型光束,其特殊性质引起了科学家的广泛关注。涡旋光束通常具有exp(ilθ)的螺旋相位波前[1-2],其中θ为方位角,l为拓扑荷数,光束中心存在相位奇点,其相位奇异性导致了涡旋光束横截面的光强呈空心的甜甜圈状分布。涡旋光束提供了一个新的复用维度,相比于基模高斯光束具有更高的自由度,其所具有的特殊相位分布和强度结构使其在光镊[3]、高维信息传输、量子信息处理[4]和光捕获[5-6]等领域展现出其独特的优势。产生涡旋光束的方法有很多,常见的可以用来产生涡旋光的器件有螺旋相位板[7]、空间光调制器(SLM)[8]和液晶q-plate[9]等。螺旋相位板存在窄带、色散、温度敏感性和尺寸等限制,在实际应用中缺乏灵活性和可调性。而SLM通过控制液晶层的光学性质,可以实现对光束空间相位的调控,具有一定的可调性和宽光谱等优点,但因存在多个衍射级次使得衍射效率低,除此之外还有响应速度慢等缺点。液晶q-plate因能通过其独特的相位结构产生偏振矢量光束和携带OAM信息的涡旋光束而受到了广泛的关注[10]。具有延迟量可电控性能的液晶q-plate,其几何相位是波片光轴方向角的2倍,相位延迟量可以在0~2π范围内连续变化,可提供更大自由度。与螺旋相位板或SLM相比,液晶q-plate具有良好的电可调谐性、较快的响应速度和尺寸灵活性,并且液晶色散特性较好可以适应宽谱波长范围光源。得益于低廉的成本和高精度相位结构,液晶q-plate已经成为科研中的常规光学器件,在通信、光调控和图像处理等领域有广泛的应用[11-14]。随着多维度光场调控需求的增加,多维度光场的生成方法也得到了科学家的广泛关注,例如阵列涡旋光束和复合涡旋光束的生成[15-19]。阵列涡旋相较于单一光束增加了空间分布上的自由度,同时还存在多个相位奇点。研究者们提出了一系列产生阵列涡旋的方法,如利用分数泰伯效应[20]、涡旋光束叠加[21]、光栅衍射[22]、多光束干涉[23-24]或涡旋激光器直接产生[25]等。但这些方法产生的涡旋阵列为离轴涡旋光[18,26-29],在传输过程中因为离轴的原因会对光强、相位及螺旋谱分布有很大的影响。离轴现象也会导致光强分布被拉伸出现变形,使原有相位线发生断裂,新的相位线生成,同时还会使OAM发生模式串扰,影响发射光束质量。这些缺点会限制涡旋阵列在各个方面的应用。近年来,科学家提出了各种同轴复合涡旋光束的产生方法,包括基于螺旋相位板的空间复用[30]、紧聚焦下纵向涡旋结构[31]和环形双涡旋光束干涉方式[32-33]。然而,基于液晶器件或q-plate的同轴复合涡旋光束的生成尚未见到报道。本文提出并设计了新型的同轴复合矢量涡旋光束,通过基于液晶结构化光取向技术所制备的复合液晶q-plate对该同轴复合涡旋光束的生成以及衍射性质进行了实验验证。为了验证所设计元件的光场调控效果,我们采用D-FFT衍射算法进行模拟计算并与实验进行对比,分析了内外圈器件拓扑荷为q1=1和q2=-1,内外圈半径比为r1∶r2=1∶3、1∶1和3∶1的同轴涡旋光束的传播特性,并按内外圈不同比例进行叠加设计并优化。结果表明,制备的同轴复合涡旋光束具有新颖的衍射特性,透射效率高达95%并能够产生丰富的干涉花瓣图案。模拟结果证明衍射图像中的花瓣来源于同轴不同涡旋光的干涉;并且在实验中发现,干涉花瓣会随着衍射距离的增加而旋转、消失和重新出现的新颖现象。普通涡旋光束简单的结构限制了其在粒子捕获和操纵等方面的应用。这类结构复杂的新型复合涡旋光束为更加复杂光场的调控提供了更多的可能性,为捕获不同尺寸、不同折射率的粒子提供了多样化解决方案,在粒子捕获和操控、光信息处理、光学加密和光学测量方面具有更大的潜在应用空间。","result":"介绍了涡旋光束及其在多个领域的应用潜力,包括光镊、高维信息传输、量子信息处理和光捕获等。讨论了产生涡旋光束的不同方法和器件,如螺旋相位板、空间光调制器和液晶q-plate,以及它们各自的优缺点。特别强调了液晶q-plate的电可调谐性、快速响应和尺寸灵活性。此外,还探讨了多维度光场调控的需求,如阵列涡旋光束和复合涡旋光束的生成方法,以及它们在传输过程中可能遇到的问题。最后,本文提出了一种基于液晶结构化光取向技术制备的新型同轴复合矢量涡旋光束,并对其生成和衍射特性进行了实验验证和模拟计算,展示了其高透射效率和丰富的干涉图案,为光场调控提供了新的可能性。","language":"zh"},{"title":"基于液晶器件的同轴复合涡旋光束的产生及调控","chapter":"2 理论基础","content":"基于液晶结构化光取向技术所制备的复合液晶q-plate可以将圆偏振光转化成内外圈拓扑荷数不同的涡旋光,并且可以通过复合涡旋光的相位差、半径比、拓扑荷等参数控制复合涡旋衍射光场。使用液晶复合q-plate调控光场的方式相较于传统的其他的生成涡旋光方式,圆偏振光通过液晶q-plate可产生与其表面相位变化所对应的涡旋光,其衍射光只有0级衍射级次,所有的能量都集中在0级上,因此满足半波条件的液晶q-plate的0级衍射效率基本等同于透射效率。另外,q-plate还具有更易于集成、精度更高、便于加工等优点。我们通过数值模拟计算并通过实验验证了具有不同参数的复合涡旋光束的衍射特性以及各个参数对于衍射图像的影响。本文制备了3种不同半径比的同轴复合液晶q-plate(同轴复合液晶q-plate的内圈器件拓扑荷为1,外圈器件拓扑荷数为-1,内外圈其相位差为0,器件工作中心波长为632.8 nm),并通过这些器件对复合涡旋光束的衍射特性进行了实验验证。我们使用DFFT算法对液晶同轴复合液晶q-plate的衍射现象进行了数值模拟。DFFT算法是基于标量衍射理论计算傍轴近似下菲涅尔衍射积分的算法。标量衍射是指当衍射孔径远大于光波长且观察面离衍射孔径距离不太近的情况下,把光波场作为标量场来处理。衍射光场的计算过程可以表示为: (1)其中,为菲涅尔衍射下的脉冲响应函数,如公式(2)所示: .(2)根据公式(1)和(2),可以将衍射积分公式计算简化为初始光场与脉冲响应函数进行卷积计算: .(3)在空域中进行卷积计算非常耗费机器时间,而在空域中进行卷积运算等同于在频域中进行乘积,所以可以把衍射光场计算从空域变到空间频域。频域中的衍射光场如式(4)所示(其中u,v为频域坐标): ,(4)脉冲响应函数可根据傅里叶变换的性质直接给出: ,(5)所以衍射光场计算的公式可以变成: .(6)根据DFFT算法可以简化衍射光场的积分计算为两次傅里叶变换。参考实验参数,物面和衍射面大小分别设置为0.2 m,光波长为632.8 nm,模拟的液晶复合q-plate的直径为0.02 m,q-plate的内圈和外圈的初相位差为0°。通过对比样品的实验结果和数值模拟结果的一致性,确认模拟程序可以很好地模拟出衍射光学元器件的衍射特性。另外,通过设置物面上初始光场的参数,可以调控内外圈的拓扑荷数、相位差和半径,通过DFFT算法计算衍射面上的衍射结果来研究这些参数对于衍射光斑旋转方向、内外圈涡旋光在衍射中的作用以及相位差改变对于衍射光斑的影响。","result":"介绍了液晶结构化光取向技术制备的复合液晶q-plate,能够将圆偏振光转化为具有不同拓扑荷的内外圈涡旋光。通过调整相位差、半径比等参数,可控制复合涡旋光的衍射特性。与传统方法相比,液晶q-plate具有高效率、易集成等优势。通过数值模拟和实验验证了不同参数复合涡旋光束的衍射特性。使用DFFT算法,基于标量衍射理论,简化了衍射光场的计算过程。实验参数设置包括物面和衍射面大小、光波长、q-plate尺寸和相位差等。通过调整初始光场参数,研究了内外圈拓扑荷、相位差等对衍射光斑的影响。实验结果与数值模拟一致,验证了模拟程序的准确性。","language":"zh"},{"title":"基于液晶器件的同轴复合涡旋光束的产生及调控","chapter":"3 液晶复合q-plate的制作和衍射光斑的测量","content":"3.1 液晶复合q-plate的制作实验中所使用的液晶复合q-plate器件采用结构化光取向技术进行制作,基于数字微镜器件(Digital Micro-mirror Device,DMD)多重曝光系统分布曝光。首先对液晶q-plate结构进行设计,根据液晶分子指向矢分布关系式仿真出复合液晶q-plate(内圈器件拓扑荷为1,外圈器件拓扑荷数为-1)的曝光取向图。其次对复合q-plate的内外半径比进行设置,将其导出为18张仅角度变化10°的黑白图。图1(a)为内外半径比为1∶1的复合q-plate黑白取向图。按顺序将这些图片导入DMD曝光系统中,激光光源会产生一束波长为405 nm的激光,通过偏振片旋转的角度控制激光的光强以及扩束整形操作传输至数字微镜器件表面,数字微镜器件通过对像素区域的改变对每张图进行45 s曝光,每次曝光后,DMD中的偏振角度旋转10°,目的是产生类似螺旋相位板连续变化的相位。这样携带偏振信息的图案就会被记录在取向材料的表面上。图1(a)仿真程序生成的曝光相位图;(b)液晶复合q-plate制作流程图;(c)~(e)内外圈半径比为1∶3、1∶1和3∶1在偏光显微镜下的光学结构。Fig.1(a) Exposure orientation picture generated by the simulator; (b) Flow chart for the production of liquid crystal mixed q-plate; (c)~(e) Optical structure of the inner and outer ring radius ratios of 1∶3, 1∶1, and 3∶1 under a polarizing microscope.液晶复合q-plate的制造过程如下:首先准备清洗干净的玻璃衬底,将其放在UV机中曝光并加热至70 ℃,目的是更好地接触取向层溶液,取向层溶液是由溶质偶氮染料SD1与溶剂二甲基甲酰胺(Dimethylformamide)以1∶200的比例混合而成。在玻璃表面滴上取向层溶液SD1,旋涂转速为2 500 r/min,持续45 s以形成均匀的薄膜。将玻璃放置在100 ℃的加热平台上蒸发溶剂12 min。待冷却后将玻璃放置在DMD的取向平台上进行曝光取向。取向后旋涂12%质量分数的液晶材料RM257溶液(溶剂为甲苯),旋涂仪转速为1 500 r/min,持续25 s。最后,在365 nm紫光照射1 min使液晶膜完全固化,从而制得满足半波条件632.8 nm的液晶层。图1(b)为使用DMD曝光制作液晶复合q-plate的流程示意图,图1(c)~(e)分别列出了内外器件拓扑荷比为1∶-1,内外圈半径比为1∶3、1∶1和3∶1的液晶复合q-plate在偏光显微镜下的光学结构。3.2 液晶复合q-plate夫琅禾费衍射光斑的测量液晶复合q-plate的衍射特性实验测量光路如图2所示。使用1/4波片(Quarter-Wave Plate,QWP)将氦氧激光器产生的632.8 nm的线偏振光转换为圆偏振光。通过低通滤波器(Gaussian Cut-Off,GCO)和光圈(Iris)对光束进行空间滤波,以获取质量较高的光束。之后,通过Lens1对光束进行准直处理。经准直后的光束通过液晶复合q-plate可以产生同轴复合涡旋光。该复合涡旋光进一步经过Lens2,形成夫琅禾费衍射并被聚焦到CCD上。最后,通过CCD记录液晶复合q-plate的夫琅禾费衍射光斑。图2衍射实验光路装置图Fig.2Diffraction experiment optical path device diagram","result":"详细描述了液晶复合q-plate的制作流程和衍射光斑的测量方法。首先,通过结构化光取向技术和数字微镜器件(DMD)多重曝光系统,设计并制作了具有特定拓扑荷的复合液晶q-plate。制作过程中,涉及到玻璃衬底的清洗、取向层溶液的旋涂、加热蒸发溶剂、DMD曝光取向以及液晶材料的旋涂固化等步骤。其次,实验测量了液晶复合q-plate产生的同轴复合涡旋光的夫琅禾费衍射特性。通过使用1/4波片将线偏振光转换为圆偏振光,经过空间滤波、准直处理和聚焦,最终利用CCD记录了衍射光斑。文中还展示了不同内外圈半径比的液晶复合q-plate在偏光显微镜下的光学结构,以及衍射实验的光路装置图。","language":"zh"},{"title":"基于液晶器件的同轴复合涡旋光束的产生及调控","chapter":"4 实验与数值模拟结果","content":"4.1 液晶复合q-plate的夫琅禾费衍射的测量和数值模拟液晶复合q-plate夫琅禾费衍射的测量光路示意图如图2所示。按照3.2节所述的实验步骤测量和记录液晶复合q-plate的夫琅禾费衍射光斑。实验所用的q-plate的内圈器件拓扑荷q1=1,外圈器件拓扑荷q2=-1。其内圈和外圈产生的涡旋光的拓扑荷分别为:m1=2,m2=-2。内圈半径r1和外圈半径r2比不同。液晶复合q-plate夫琅禾费衍射的模拟结果如图3所示,图中对比了实验结果和仿真模拟结果。在相同半径比下,衍射实验结果与模拟结果吻合良好。尽管由于内外圈半径的不同,3个样品的衍射图样不同,但在实验结果和模拟结果中都出现了因干涉而产生的花瓣,这符合拓扑荷数m1=2和m2=-2的涡旋光的干涉规律。图3液晶复合q-plate数值模拟结果与衍射实验结果对比Fig.3Comparison of numerical simulation results and diffraction experimental results of liquid crystal mixed q-plate通过模拟液晶复合q-plate内圈和外圈独立传播时的夫琅禾费衍射图像来进一步研究。如图4所示,分别对涡旋光的内外圈进行模拟衍射,并观察其结果。需要注意的是,在q-plate不具有相位分布的区域不仅没有相位分布,且这部分不透光光强为0。因此,模拟结果显示,当复合q-plate的内外圈涡旋光单独进行衍射时,并不会产生花瓣状图案,而是保持了涡旋光的传播特性。因此,可以得出结论,图3中出现的花瓣是由内外圈涡旋光相互干涉产生的,并且花瓣的数量也符合涡旋光的干涉规律。图4液晶复合q-plate内外圈分别衍射的模拟结果Fig.4Simulation results of diffraction of inner and outer rings in liquid crystal mixed q-plate从图4中可以看出,液晶复合q-plate的外圈涡旋光,也就是具有圆环状相位分布的涡旋光在进行单独衍射后,其远场衍射光强图像与一般涡旋光远场衍射的光强分布不同,具有多阶环状强度分布。这些多阶环状强度并不是高阶衍射级次,而是单束涡旋光束由于空间分布不均匀造成的,单束涡旋光束极坐标下的傅里叶变换可以展开成超几何方程[34]: (7)从公式(7)可以看出,不同拓扑荷数的涡旋光的远场衍射呈多阶环形相位分布。当复合液晶q-plate的外圈涡旋光单独进行远场衍射时,产生多阶环形相位分布,光强则呈现多阶环状强度分布。此外,外圈涡旋光衍射后的旁瓣半径相对于内圈涡旋光的旁瓣半径更小。当液晶复合q-plate内圈器件拓扑荷q1=0时,模拟结果如图5所示。从图5中可以看出,当q1=0时,内圈仍与外圈发生了干涉,形成了花瓣状的图样,并且随着q-plate的r1越来越大,其夫琅禾费衍射光斑半径在逐渐变小,内部花瓣也在收缩。图5液晶复合q-plate在q1=0、 q2=-1时的模拟结果。Fig.5Simulation results of liquid crystal mixed q-plate with q1=0, q2=-1.4.2 液晶复合q-plate的内外圈相位差和内外圈拓扑荷数正负性对夫琅禾费衍射的影响液晶复合q-plate内外圈拓扑荷正负性、内外圈涡旋光相位的相位差对于衍射影响的模拟结果如图6所示。当内外圈拓扑荷数正负性发生变化时,衍射光斑的旋转方向也发生了变化,旋转方向完全相反。图6液晶复合q-plate内外圈拓扑荷数正负性对衍射斑影响的模拟结果Fig.6Simulation results of the influence of the positive and negative topological charge numbers of the inner and outer rings on the diffraction spots in liquid crystal mixed q-plate如图7所示,调节内外圈涡旋光的相位差后,发现当内外圈相位差发生变化时,其衍射光斑发生了旋转,除此之外衍射光斑完全相同。当内圈和外圈拓扑荷正负性相反,相差相同相位差为φ时,其旋转方向刚好相反。图7液晶复合q-plate内外圈相位差对衍射光斑的影响,q1∶q2=1∶-1。Fig.7Effect of phase difference between inner and outer circles of liquid crystal mixed q-plate on diffraction spot, q1∶q2=1∶-1.4.3 液晶复合q-plate不同距离下的菲涅尔衍射图样液晶复合q-plate在不同距离下模拟的菲涅尔衍射图样如图8所示。从图8(a)中可以看出,随着衍射距离(Diffraction distance, DD)的变大,干涉花瓣越来越大,DD>128 m后,干涉花瓣开始消失,最后成为散斑。图8(b)和图8(c)图样显示,随着衍射距离的变大干涉花瓣越来越大,距离更大之后变为散斑消失。图8不同衍射距离下的液晶复合q-plate的菲涅尔衍射图样。(a) r1∶r2=1∶3; (b) r1∶r2=1∶1;(c) r1∶r2=3∶1。Fig.8Fresnel diffraction patterns of liquid crystal mixed q-plate at different distances. (a) r1∶r2=1∶3; (b) r1∶r2=1∶1; (c) r1∶r2=3∶1.","result":"通过实验和数值模拟研究了液晶复合q-plate的夫琅禾费衍射特性。实验测量了不同半径比的q-plate产生的涡旋光的衍射光斑,发现实验结果与模拟结果吻合良好。模拟结果表明,内外圈涡旋光的干涉产生了花瓣状图案,且花瓣数量符合干涉规律。进一步模拟显示,当内外圈涡旋光单独衍射时,不会产生花瓣状图案,而是保持了涡旋光的传播特性。此外,外圈涡旋光单独衍射时,远场衍射光强呈现多阶环状强度分布,这是由于单束涡旋光束的空间分布不均匀造成的。\n\n研究还发现,液晶复合q-plate内外圈拓扑荷数的正负性以及相位差对夫琅禾费衍射光斑有显著影响。当内外圈拓扑荷正负性相反时,衍射光斑的旋转方向完全相反;当调节相位差时,衍射光斑发生旋转。此外,当内圈器件拓扑荷为0时,内圈与外圈仍发生干涉,形成花瓣状图样,且随着内圈半径的增大,衍射光斑半径逐渐变小。\n\n最后,还模拟了液晶复合q-plate在不同距离下的菲涅尔衍射图样。结果表明,随着衍射距离的增加,干涉花瓣逐渐变大,当衍射距离大于128 m时,花瓣消失,最终变为散斑。这些发现为理解和调控基于液晶器件的同轴复合涡旋光束提供了重要信息。","language":"zh"},{"title":"基于液晶器件的同轴复合涡旋光束的产生及调控","chapter":"5 结论","content":"本文简要介绍了液晶复合q-plate的制作流程、衍射实验光路、个别样品的衍射图样以及各类数值模拟结果。制备了内外圈器件拓扑荷数q1=1和q2=-1,内外圈初相位差为0,内外圈半径比r1∶r2=1∶3、1∶1和3∶1三种液晶复合q-plate,其透射效率均大于95%。使用CCD记录了它们的夫琅禾费衍射光斑,实验结果与数值模拟结果表明,模拟程序较好地模拟了液晶复合q-plate的衍射特性,证实了数值模拟的准确性。基于初步的数值模拟结果,进一步模拟了内外圈分别进行夫琅禾费衍射的情况。模拟结果表明,本文所制作的液晶复合q-plate的衍射图案中的干涉花瓣源于内外圈涡旋光的干涉。外圈单独进行衍射时产生的多阶环状强度并不是高阶衍射级次而是因为涡旋光的衍射特性形成的,其远场衍射光强呈现多阶环状强度分布。此外,还模拟了内圈器件拓扑荷数为q1=0时的夫琅禾费衍射图样,外圈圆环半径越窄则衍射光斑越小。有趣的是,当内外拓扑荷数的正负性固定时,内外圈的相位差会引导衍射光斑进行旋转,而且,如果正负性相反,旋转方向也会相反。从模拟的菲涅尔衍射结果中发现一个有趣的现象:当r1∶r2=1∶3时,随着衍射距离的增大,干涉花瓣会逐渐消失。模拟结果表明,液晶复合q-plate的菲涅尔衍射光斑会随着衍射距离的增加而逐渐旋转。","result":"介绍了液晶复合q-plate的制作和实验验证,展示了其高透射效率和衍射特性。实验与数值模拟结果一致,证实了模拟的准确性。进一步模拟分析了内外圈的衍射特性,揭示了干涉花瓣的来源和旋转现象。菲涅尔衍射模拟显示,衍射光斑随距离增加而旋转,且特定半径比下干涉花瓣会消失。","language":"zh"}]
      孙巍,周昕怡,樊帆,谢向生,周雅琴
      2023, 38(12): 1664-1671. DOI: 10.37188/CJLCD.2023-0264
      摘要:传统的多涡旋光束多为离轴光束,需要更精密的镜头、光路复杂且成像质量差,限制了其应用。本文设计并制备了一种基于液晶器件的复合q-plate,其透射效率大于95%,同时可生成同轴复合涡旋光束。通过理论和实验证明了该器件生成的复合涡旋光束的传播特性,该光束具有自旋和长距离衍射后自愈等新颖的衍射现象,生成的同轴复合涡旋光束避免了传统多涡旋光束离轴的缺点。此研究为粒子捕获和操控、光信息处理、光学加密和光学测量等领域的应用提供了全新的手段。  
      关键词:液晶结构化光取向器件;同轴复合涡旋光束   
      148
      |
      86
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42237135 false
      发布时间:2024-07-28
    • [{"title":"基于不同色转换方式下占空比与色差的关系","chapter":"1 引言","content":"液晶显示(LCD)是非发射性的,因此它需要背光单元,背光会增加LCD面板的厚度并限制其柔性。然而,LCD可以使用高效率且长寿命的蓝光LED作为背光,并使用氟化物荧光粉或量子点作为颜色转换层以实现宽色域,尤其是量子点增强型LCD比OLED表现出更宽的色域,且具有更优的峰值亮度和寿命[1]。鉴于产业和技术成熟度以及成本因素,目前LCD在市场上仍然占据主导地位。微发光二极管(Micro LED)显示是像素主动发射性的,支持快速响应、高像素密度、高对比度、高比特深度、出色的暗状态、宽色域、宽视角、宽操作温度范围和灵活的形状因子[2]。随着半导体显示技术的发展和需求推动,Micro LED显示由于其优异的画质性能以及高可靠性,被誉为下一代显示技术。目前巨量转移工艺良率和效率还处于比较低的水平,以及Micro LED芯片尺寸微小化后EQE急速降低,导致目前Micro LED显示还达不到规模化生产的阶段[3]。近两年出现的Mini LED背光技术搭配宽色域色彩转换方案,使液晶显示画质水平得到了质的提升。结合Mini LED背光技术,超薄LCD偏振光学元件在增强现实(AR)、虚拟现实(VR)领域亦有着很好的应用前景[4]。预计未来几年,LCD液晶显示仍然会占据显示领域的主要份额。LCD背光的白光色彩转换方案包括蓝光激发钇铝石榴石(YAG)黄粉、蓝光激发氮氧化物(β- SiAlON)+氟化物(KSF)红粉、蓝光激发红绿量子点(QD)荧光膜等3种方式。3种色彩转换方式都是铟镓氮(InGaN)蓝光LED芯片电致发光和荧光粉光致发光的结合,荧光粉采用的均是瞬余辉荧光类型,即激发后大部分能量释放发光,少部分能量延迟释放。蓝光激发YAG黄粉是常用的液晶显示背光色彩转换方案,用LED芯片电致发光发出的450 nm左右波长的蓝色光激发掺铈(Ⅲ)的钇铝石榴石(YAG∶Ce³+)荧光粉转换为白光,此种方式性能稳定,成本低,但色域不广。蓝光激发β-SiAlON+KSF红粉的方式能拓宽色域,其中KSF红粉以Mn4+作为激活剂,以K2SiF6∶Mn4+(KSFM)为典型代表,其最强吸收峰与蓝光芯片发射峰匹配良好,匹配蓝光LED时重吸收效应不明显[5]。在LED背光显示中,KSF粉由于发射峰窄和无自吸收等特点能实现高激发效率和宽色域显示[6-7]。β-SiAlON是(Si,Al)(O,N)4四面体为基本结构单元而形成空间网络结构的氮氧化物。β-SiAlON∶Eu2+绿色荧光粉是一种稀土掺杂的荧光粉,发射峰光谱半高宽约为52 nm,较常规绿粉半高宽要窄,热淬灭温度高,化学稳定性强[8-9],与氟化物KSF红粉搭配经常用于高色域背光产品。蓝光激发红绿量子点荧光膜是高阶LCD机型的使用方案,量子点辐射光谱的半高宽窄,在3种色彩转换方案里色域最广。在同等条件下,量子点电视相较于普通电视可以有效减少人眼的疲劳程度,增加用户的认知效率和速度[10-11]。因此,宽色域显示机型中使用量子膜的产品逐渐增多。Mini LED背光显示技术使用分区控制电路,结合峰值亮度算法来提升对比度。控制电路含PM和AM驱动方式,目前采用的主要为AM驱动方案。此种电路在不同的灰阶画面信息下,通过数字调光方式调节电流波形的占空比进行各分区亮暗程度变化的调节。由于存在电流幅值的台阶变化以及电流开启关断周期,这种流经蓝光LED芯片的电流波形的变化使蓝光辐射能量发生变化,与之搭配的各种色彩转换背光可能产生新的光学问题。尤其是近期采用Mini LED背光的电视、显示器、车载显示等产品份额逐渐增多,色转换方式均使用量子点色转换和KSF粉色转换方式,出现了屏幕在不同灰阶画面下颜色偏差、灰阶切换时存在“红爆”现象等问题。显示产品除了追求高对比度、宽色域等画质性能外,还需要避免动态显示时画质颜色骤变问题,减轻消费者观看时的视觉疲劳。本文对电流调光模式下3种色彩转换背光方案的显示产品进行了测试分析。结果表明,3种色彩转换方案在不同电流占空比条件下的亮度变化趋势基本呈线性关系,但色坐标变化趋势差异明显。随着电流的变化,蓝光激发β-SiAlON+KSF红粉转换方案样品在3种样品中色坐标变化差异值最大,且红色变化比绿色明显。蓝光激发红绿量子点转换方案的色坐标变化介于其他两种方案之间,且绿色变化比红色明显。经分析,色坐标变化差异与红绿粉的量子激发效率差异有关。通过缩短KSF荧光粉的余辉时间及驱动电流调光周期可以消除“红爆”现象。","result":"液晶显示(LCD)依赖背光单元,其中蓝光LED配合荧光粉或量子点实现宽色域。量子点增强型LCD在色域、亮度和寿命方面优于OLED,但成本和成熟度限制了其市场地位。Micro LED显示技术具有快速响应和高对比度等优点,被视为下一代显示技术,但目前面临良率和效率问题。Mini LED背光技术结合宽色域方案提升了LCD画质,尤其在AR和VR领域有应用潜力。LCD背光的白光色彩转换方案包括YAG黄粉、β-SiAlON+KSF红粉和量子点荧光膜,各有优缺点。Mini LED背光显示技术通过AM驱动方案调节占空比提升对比度,但可能引起颜色偏差和“红爆”现象。本文测试分析了3种色彩转换背光方案在不同电流占空比下的亮度和色坐标变化,发现色坐标变化趋势差异明显,与荧光粉的量子激发效率差异有关。通过调整KSF荧光粉的余辉时间和驱动电流调光周期,可以解决“红爆”问题。","language":"zh"},{"title":"基于不同色转换方式下占空比与色差的关系","chapter":"2 实验","content":"分别对采用3种色彩转换技术背光的75 in(1 in=2.54 cm)液晶电视进行测试,3种色彩转换技术均采用LED芯片发射的蓝光激发荧光粉进行白光色彩转换,样品1的色彩转换方式为蓝光激发YAG黄粉,样品2的色彩转换方式为蓝光激发β-SiAlON+KSF红粉,样品3的色彩转换方式为蓝光激发红绿量子点荧光膜。采用数字调光控制电路时,电视机菜单打开脉冲宽度调制(PWM)调光模式,峰值电流不变,电流波形正占空比从10%依次增加到100%,测量不同电流占空比条件下的样品光学表现。调光电流波形如图1所示,如红色竖线和箭头示意,电流波形下降沿箭头方向推移,则电流波形正占空比不断加大。当红线向右移到与下一个周期的上升沿重叠时,正占空比达到100%,电流波形为一条直线。图1中的状态为占空比49.789%,电流通断频率为15.5 kHz,对应一个通断周期为64 μs,为液晶显示背光典型的驱动电流工作状态。图1调光模式的电流波形Fig.1Dimming mode current waveform样本置于照度低于0.1 lx的暗房内进行测试。采用CS2000分光辐射亮度计进行整机样品的光学测试,采用滨松C11347-11量子产率测量仪进行激发效率测试,采用SDS6054 H10 Pro数字示波器及HCP8030D电流探头进行电流波形监测。采用PG信号发生器进行画面灰阶信号切换,观测不同灰阶切变过程中的视觉感应。","result":"通过实验研究了75英寸液晶电视在3种不同色彩转换技术下的占空比与色差关系。实验中,使用数字调光控制电路,通过脉冲宽度调制(PWM)模式调节电流占空比,并测量其对样品光学表现的影响。实验在暗房中进行,采用多种仪器进行光学测试、激发效率测试和电流波形监测,并观察不同灰阶切换下的视觉感应。","language":"zh"},{"title":"基于不同色转换方式下占空比与色差的关系","chapter":"3 结果与分析","content":"3.1 实验结果3.1.1 数字调光模式下3种色彩转化方案的光学差异3种色彩转换样品的辐射光谱波形如图2所示,3种色彩转换光谱特征差异明显。3种方式均为蓝光LED芯片通电发射出蓝光去激发荧光粉,其中一部分蓝光穿透出荧光粉,一部分蓝光被荧光粉吸收激发出其他颜色的光谱波段。图2中3种色彩转换方案的波形均有蓝色的尖峰波形。其中图2(a)为蓝光激发YAG黄粉,荧光粉激发波段为一个宽波段平缓的黄光波段;图2(b)为蓝光激发β- SiAlON+KSF红粉,KSF红粉被激发出尖刺状的红光尖峰组合,β-SiAlON被激发出凸包状的半高宽相对窄的绿光波段;图2(c)为蓝光激发红绿量子点荧光膜,量子点被激发出红色和绿色两个比较陡的凸包状波段。每种色转换方案不同波段颜色最终混合成为白光。图2(a) YAG荧光粉色彩转换辐射光谱图;(b) 氟化物色彩转换辐射光谱图;(c) 量子点色彩转换辐射光谱。Fig.2(a) YAG color conversion radiation spectrum;(b) Fluoride color conversion radiation spectrum;(c) Quantum dot color conversion radiation spectrum.使用上述3种背光的电视样品在调光电流驱动模式下进行光学测试。在数字调光模式下,3种色彩转换样品机型的画质表现如图3所示。图3(a) YAG荧光粉色彩转换在不同电流占空比下的画面变化;(b) 氟化物色彩转换在不同电流占空比下的画面变化;(c) 量子点色彩转换在不同电流占空比下的画面变化。Fig.3(a) Picture changes in YAG color conversion under different current duty;(b) Picture changes in fluoride color conversion under different current duty;(c) Picture changes in quantum dot color conversion under different current duty.目前对同一台机的显示效果色坐标差值没有具体的标准,SJ/T 11343-2015《数字电视液晶显示器通用规范》仅对白平衡误差Δ和Δ值定位≤0.02,具体的颜色变化容许范围由各个生产厂家内部主观评测判定。如图3所示,在10%电流占空比和100%电流占空比条件下,3种色彩转换方式显示的主观视效差别比较大。图3(a)为YAG粉色转换显示产品,10%占空比和100%占空比条件下主要为亮度灰阶变化。图3(b)为KSF荧光粉色转换显示产品,两种电流条件下的主观色温差距明显,100%占空比比10%条件下明显颜色偏蓝色温偏冷。图3(c)为量子点显示产品,两种电流条件下的主观颜色差距不明显。将上述3款样品进行光学数据采集测试,3种色彩转换样品的亮度与色坐标变化数据如图4所示。图4中ΔL为不同电流占空比条件下的亮度与100%电流占空比条件下的亮度比值,Δx为不同电流占空比条件下的CIE x色坐标与10%电流占空比条件下的CIE x色坐标差值,Δy为不同电流占空比条件下的CIE y色坐标与10%电流占空比条件下的CIE y色坐标差值。图4(a) YAG荧光粉色彩转换在不同电流占空比下的光学变化;(b) 氟化物色彩转换在不同电流占空比下的光学变化;(c) 量子点色彩转换在不同电流占空比下的光学变化。Fig.4(a) Optical changes in YAG color conversion under different current duty;(b) Optical changes in fluoride color conversion under different current duty;(c) Optical changes in color conversion of quantum dots under different current duty.如图4测试数据所示,3种色彩转换方案在不同电流占空比条件下的亮度变化趋势基本呈线性关系,但色坐标变化趋势差异明显。图4中色坐标差值为不同电流占空比条件下与100%占空比条件下的对比差值,3种色彩转换方案低电流占空比条件下的CIE xy坐标值均比100%电流占空比条件下的CIE xy坐标值大,即100%电流占空比条件下白场色温最高。如图4(a)YAG粉转换方案,从10%电流占空比增加到100%占空比,CIE y色坐标值减小在0.002 5范围内,CIE x色坐标值减小在0.002 0范围内,色坐标值变化不明显,此方案调光模式下画质颜色表现稳定。图4(b)β-SiAlON+KSF红粉转换方案的色坐标变化差异在3种样品中是最大的,其CIE y色坐标变化在0.007范围,但CIE x色坐标变化达到了0.012,红光变化比绿光明显,色温差值达到2 400 K,因此近几年行业内一直有使用KSF粉会产生“红爆”效应的意见存在。图4(c)红绿量子点转换方案的色坐标值变化介于前面两种方案之间,CIE y色坐标变化在0.009范围内,CIE x色坐标变化在0.007范围内,绿光变化稍微比红光变化明显。3.1.2 灰阶切变的红爆现象测试因KSF粉是短余辉材料,余辉时间在毫秒级别,相对绿粉时间长,行业内出现过灰阶切换时有“红爆”现象的说法。“红爆”现象是指画面切换时人眼观察到的突然的红色残影留存现象。将采用蓝光激发β-SiAlON+KSF红粉LED的电视样品置于暗房,在调光模式下进行灰阶画面切换,电流波形占空比随灰阶画面切换而变化。选择20名观察者进行画面观测并记录观看反应的结果。观察者年龄分布为20~50岁,男性与女性人员各占1/2,观测结果如表1所示。测试结果表明,在有明显差距的灰阶信号切换过程中,如全白场G255亮度画面切换到G0的暗场画面,以及G255亮度画面切换到G30灰度等各种不同跨距的灰阶画面切换,现有样品均未观察到“红爆”现象。表1灰阶切变时的“红爆”现象观测Tab.1Observation of the“red explosion”phenomenon during gray scale switching3.2 结果分析3.2.1 3种色彩转换方案色坐标变化情况分析3种白光色彩转换方案电视的光学表现,本质上是背光光谱拟合彩色滤光膜后屏幕出射光谱的表现,与背光源材料特性相关。辐射光谱红、绿、蓝3个波段的半高宽越窄、波段越独立,则色域越高,所以蓝光激发红绿量子点材料的色彩转换方案色域最高;而KSF粉的红光波段半高宽最窄,因此红色表现最鲜艳。掺铈的钇铝石榴石荧光粉(YAG∶Ce3+)是常用的白光LED荧光粉,其辐射光谱只有一个黄绿色的宽带状光谱波段,光学性能稳定,光致激发效率高,随蓝光激发能量变化产生的色坐标变化值小。其为瞬短余辉型荧光粉,即激发后大部分能量释放发光,少部分能量延迟释放,荧光粉余辉的衰减呈指数形式,由一个快速衰减和慢衰减过程构成,余辉时间为纳秒级别,约为65.7 ns[12-13]。数字调光的背光主动式电流驱动频率在15~30 kHz之间,周期时间为33~66 μs。与之对比,YAG粉纳秒时间的余辉基本可以看成是即时响应,因此背光采用数字调光模式对此类荧光材料色彩转换方式的显示产品光学变化不会有影响。由三基色单位[X]、[Y]、[Z]与物理三基色单位[R]、[G]、[B]之间的转换公式(1),以及CIE 1931色坐标相对色系数计算公式(2)可知,计算三基色系数权重X偏重于红色,Y偏重于绿色,Z偏重于蓝色。即CIE x坐标与红光能量占比权重关系最大,CIE y坐标与绿光能量占比权重关系最大,CIE xy色坐标的变化本质上是红绿蓝3种光能量占比的变化,占比变化差值越大则x、y坐标变化差值越明显。 .(1), .(2)当驱动电流增大时,蓝光辐射能量增加,但各类荧光材料的激发效率无法达到100%,因此红绿能量的增加幅度比不上蓝光能量的增加幅度,即Z值比例增加,X和Y的比例减小,对应CIE x和CIE y坐标减小,色温会向冷色温方向偏移,即100%占空比电流条件下的白场色温比低占空比电流条件下的色温要高。YAG荧光粉的激发辐射光谱因为只有一个黄绿色波段,红光和绿光能量变化基本上同步增加,因此蓝光激发YAG荧光粉色彩转换方案的色坐标随电流变化的差异值较小。量子点(quantum dots,QDs),又称半导体纳米晶,是在纳米尺度上的原子和分子的集合体,目前市面上背光用的量子点膜材料主流还是由ⅡB、ⅥA族元素组成,如CdS、CdSe、CdTe、ZnSe等。其红绿量子点材料光致发光颜色单一纯净,两个颜色波段重叠小,波段半高宽比较窄可以做到30 nm以内,因此色域表现优秀。背光用的镉系量子点的余辉寿命为20~50 ns,钙钛矿类红绿量子点余辉寿命为20~152 ns[14],现有频率的数字调光模式对其光学变化影响不大。但使用量子膜的显示背光设计一般会有其他扩散类或亮度增益类的膜片覆盖在量子膜上面,量子膜与其他光学膜片之间存在明显的、大面积的、多次的蓝光反射现象。因此,随着驱动电流均值加大,蓝光芯片发射的光辐射能增加,一部分蓝光能量被量子膜中的材料吸收转换为红光和绿光,一部分蓝光能量穿透量子膜再穿透上面的其他光学膜片出射,但有部分蓝光接触到其他膜片界面尤其是带棱镜微结构的其他光学膜片界面时并不会穿透出去,而是对蓝光进行多次反射,此部分蓝光能量被反射返回量子膜中,进行n次的光致激发过程。即随着电流的加大,量子膜转化方式的光学变化会比荧光粉设置在LED封装上的光学变化强烈。同时,量子点色彩转换方案有红绿两种激发效率不同的荧光材料,激发光谱有两个独立的波段,随电流变化时两个波段的能量变化幅度会有差异,因此量子点色彩转换背光方案的显示产品的色坐标变化程度强于YAG荧光粉色彩转换背光方案的显示产品。背光常用的蓝光芯片辐射波段在447.5~460 nm之间。如图5所示,对量子点荧光胶水进行测试发现,这个波段蓝光激发的绿光量子激发效率要略高于红光量子激发效率。蓝光能量经过量子膜时,量子膜中红光量子点材料与绿光量子点材料接收到相同辐射浓度的蓝光能量,电流增大则蓝光能量增加,因绿光量子点在此波段蓝光激发效率高于红光量子点,经蓝光光致激发之后的绿光能量增比要大于红光能量增比。因此,依据公式(1)和公式(2),当电流值变化时,量子点色彩转换方案的CIE y色坐标的变化值要比x坐标变化值大。图5红绿量子点的激发效率Fig.5Excitation efficiency of red and green quantum dots如图4所示,蓝光激发β-SiAlON+氟化物KSF红粉色彩转换方案的色坐标变化差异值在3种方案中是最大的,且随着电流变化,CIE x色坐标变化比y坐标明显。电流占空比在10%~100%时,其CIE x色坐标变化值达到了0.012,色温差值达到2 400 K。Mn4+掺杂氟化物KSF荧光粉在蓝光区有强烈的宽带吸收光谱,由于d-d轨道跃迁产生尖峰发射,在红光区有强烈的窄带辐射光谱,其室温下荧光内量子效率为77%~90%[15-16]。绿光采用β-SiAlON荧光粉转换,β-SiAlON属于氮氧化物荧光粉,结构源于β- Si3N4,部分Si—N键被Al—O键取代,其化学式为Si6-zAlzOzN8-z,通过调节配位数z和掺杂来调节发射光谱主峰和带宽。随着z值降低,激发光谱特征激发峰越来越明显,可以减小半高宽值,提高色域,但同时随着z值的降低,量子效率呈降低趋势。发射主峰位于535 nm,半峰宽为55 nm的β- SiAlON∶Eu2+荧光粉,在450 nm激发下的内量子效率仅为50%[8,17]。β-SiAlON绿粉的量子激发效率比KSF红粉低,导致蓝光能量随电流值变化时,光致激发出的红光能量变化比大于绿光能量变化比,依据公式(1)和公式(2),体现在CIE色坐标上则CIE x色坐标变化值大于y坐标变化值。同时,由于β-SiAlON和KSF两种荧光粉材料种类不同,光致发光辐射光谱绿光波段和红光波段的发射峰特征差异明显,激发效率也差距明显,导致此种色彩转换方案的显示产品在电流值变化时CIE xy色坐标变化幅度比YAG粉和量子点色彩转换方案显著。3.2.2 KSF色彩转换模式灰阶切换情况分析如表1所示的灰阶切变时的颜色变化观察结果,在有明显差距的灰阶信号切换过程中,例如全白场G255高亮度画面切换到G0的暗场画面,电流波形从占空比100%的高电流突变到0电流幅值,现有样品并未观察到“红爆”现象。如表2所示,YAG荧光粉及量子点荧光材料的激发余辉时间均在纳秒级别,但KSF荧光粉的余辉时间为毫秒级别,KSF荧光粉的余辉时间相对较长。表2不同荧光材料性能表现Tab.2Performance of different fluorescent materialsKSF荧光粉的光致发光延时现象导致近几年来行业内一直担心使用KSF荧光粉会产生“红爆”现象。经过一系列的材料组分改进以及粉体结晶质量的提升,白光LED使用的KSF荧光粉余辉时间已经从几十ms缩短到了目前的2~7.6 ms[18-19]。而β-SiAlON∶Eu2+属于稀土掺杂的氮氧化物荧光粉,其发光机制是占据β-SiAlON基质晶体中晶格管状通道位置的稀土离子Eu2+在激发光作用下利用4f65d~4f7跃迁实现荧光发射[20-21],荧光时间短,余辉时间在纳秒级别。两种不同响应时间的荧光材料同时接收到相同能量变化幅度的蓝光激发时的响应过程如图6所示。图6时间相关的荧光变化Fig.6Time-dependent transitionInGaN LED芯片的电致发光发射出蓝光,芯片表面荧光胶中的β-SiAlON与KSF粉同时接收到蓝光能量,受激产生光致发光效应分别转换发射出绿光和红光。半导体材料InGaN电致发光的响应时间为纳秒级别,β-SiAlON∶Eu2+受激光致发光的响应时间为纳秒级别,随着电流波形拉升或降低,绿光能量变化幅度与蓝光变化幅度曲线基本同步。但KSF荧光粉的光致发光响应时间为毫秒级别,受激和发射的过程存在延时效应,因此在电流开启和关断的时间红光能量曲线和蓝绿光不同步。KSF荧光粉是瞬短余辉材料,通过掺杂组分调整可以调整余辉寿命在2 ms~2 min时间范围,对此已有相对比较详细的研究[20,22]。在显示领域,要消除大差距灰阶画面切变下的“红爆”现象,需要调整KSF组分将屏幕画面留存变化提高到人眼识别频率范围之外,即降低荧光寿命时间。人眼能分辨的极限频率是50 Hz,周期时间大约是20 ms,10 ms以内的颜色亮度变化人眼很难观测到。如果是前期的KSF粉,余辉时间在50~80 ms,亮暗灰阶画面切换过程中人眼可以捕捉到红光余辉现象,但是目前背光LED白光用的KSF荧光粉经过材料改进后,余辉的台阶延时已经大幅缩短到了2~10 ms,在灰阶画面切换时是观察不到红光余辉即“红爆”现象。另外,相较于旧的电路调光模式,调光频率已经得到大幅提高,对应调光周期缩短,频闪感应降低,画面光学切变顺滑度提高。如图1所示,数字调光主动式驱动电流调光频率在15~30 kHz之间,对应周期在64~32 μs;被动式驱动电流调光频率约在1.5 kHz左右范围,对应周期在640 μs。在微秒级别的调光周期内,蓝光电致发光和绿光光致发光过程可以快速响应,红光光致发光延时过程中经过了n轮的叠加,产生类似于积分的过程,除了上电开启及断电关闭两个时间节点,其余阶段可看成是连续平缓的红光能量发射,","result":"通过实验结果和分析,探讨了基于不同色转换方式下占空比与色差的关系。实验中,三种色彩转换样品的辐射光谱波形表现出明显差异,均通过蓝光LED芯片激发荧光粉产生不同颜色光谱波段,最终混合成白光。在数字调光模式下,三种样品的画质表现在不同电流占空比下有显著差异,尤其是KSF荧光粉色转换显示产品在不同电流条件下的主观色温差距明显。\n\n光学测试结果显示,三种色彩转换样品的亮度与色坐标变化趋势基本呈线性关系,但色坐标变化趋势差异明显。YAG荧光粉色彩转换方案在调光模式下画质颜色表现稳定,而β-SiAlON+KSF红粉转换方案的色坐标变化差异最大,导致行业内存在使用KSF粉会产生“红爆”效应的意见。量子点色彩转换方案的色坐标值变化介于前两者之间。\n\n针对KSF粉的“红爆”现象,实验中通过灰阶画面切换测试,发现现有样品并未观察到该现象。KSF荧光粉的余辉时间为毫秒级别,经过材料组分改进和结晶质量提升,余辉时间已缩短至2~7.6 ms,降低了“红爆”现象的风险。\n\n结果分析指出,不同色彩转换方案的光学表现与背光光谱拟合彩色滤光膜后屏幕出射光谱的表现相关。量子点材料色域最高,KSF粉红色表现最鲜艳,而YAG荧光粉光学性能稳定,色坐标变化值小。数字调光模式对YAG粉色彩转换方式的显示产品光学变化无影响,而量子点色彩转换方案的光学变化较荧光粉设置在LED封装上的光学变化强烈。\n\n此外,KSF荧光粉的光致发光延时现象导致行业内担心产生“红爆”现象,但经过材料改进,余辉时间已大幅缩短,降低了该现象的风险。数字调光频率的提高和调光周期的缩短也有助于减少频闪感应,提高画面光学切变顺滑度。","language":"zh"},{"title":"基于不同色转换方式下占空比与色差的关系","chapter":"4 结论","content":"LCD背光的白光色彩转换包括蓝光激发YAG黄粉、蓝光激发β-SiAlON绿粉+KSF红粉、蓝光激发红绿量子点荧光膜等3种方式。在数字调光模式下,3种色彩转换方案在不同电流占空比条件下的亮度变化趋势基本呈线性增加,但色坐标变化趋势差异明显。随着电流的变化,YAG粉转换方案机型色坐标变化最小,蓝光激发β-SiAlON+KSF红粉转换方案在3种方案中色坐标变化差异值最大,其CIE y色坐标变化在0.007范围,CIE x色坐标变化达到了0.012,红色变化比绿色明显。蓝光激发红绿量子点转换方案的色坐标变化方案范围介于其他两种方案之间,CIE y色坐标变化在0.009范围内,CIE x色坐标变化在0.007范围内,绿色变化比红色稍微明显。经分析,色坐标变化与红绿粉的量子激发效率差异有关。通过缩短KSF粉余辉时间及驱动电流调光周期时间,目前的蓝光激发β-SiAlON+KSF红粉色彩转换方案未观察到“红爆”现象。在新型显示领域,Mini LED背光显示产品份额逐年增加,对应高色域色转换方案如量子点和KSF荧光粉色转换方案的产品增多,尤其是为了降低成本,KSF荧光粉的色转换方案会替代一部分量子点色转换方案产品,仔细研究KSF荧光粉的色转换方案在不同电流条件下的光学表现,在提高显示画质的同时提升观看者的眼睛舒适度很有必要。Micro LED显示领域由于红光LED芯片的制程良率低和成本高的原因,也有一些LCD产品采用量子点色转换方案,部分微小间距产品亦采用KSF荧光粉的色转换方案。鉴于KSF荧光粉的色转换方案在不同电流条件下的颜色差距,固定峰值电流并PWM调宽电流均值、提高驱动刷新频率,将是解决此类问题的一个方向。另外,钙钛矿量子点方案与新型显示领域的应用需求有较好的匹配,目前此类产品的性能[22]基本可与传统镉系量子点的高色域和转换效率不相上下,在解决批量生产的工艺问题之后,有望降低量子点产品的成本并拓展更多的应用空间。","result":"论文结论部分指出,在数字调光模式下,三种LCD背光白光色彩转换方式的亮度变化趋势线性增加,但色坐标变化趋势有明显差异。YAG粉转换方案色坐标变化最小,而蓝光激发β-SiAlON+KSF红粉方案色坐标变化最大,红色变化比绿色明显。量子点转换方案色坐标变化介于两者之间,绿色变化稍明显。色坐标变化与红绿粉量子激发效率差异有关。通过技术改进,蓝光激发β-SiAlON+KSF红粉方案未出现“红爆”现象。随着Mini LED背光显示产品份额增加,高色域色转换方案需求上升,KSF荧光粉方案可能替代部分量子点方案。研究KSF荧光粉在不同电流条件下的光学表现,对提高显示画质和观看舒适度至关重要。Micro LED显示领域中,由于红光LED芯片成本高和良率低,部分产品采用量子点或KSF荧光粉色转换方案。固定峰值电流、PWM调宽电流均值和提高驱动刷新频率,是解决KSF荧光粉色转换问题的方向。钙钛矿量子点方案与新型显示需求匹配良好,有望在解决生产问题后降低成本并拓展应用。","language":"zh"}]
      杨梅慧,钟文馗,林伟瀚,胡文党,陈俐闯,谢沛川
      2023, 38(12): 1672-1680. DOI: 10.37188/CJLCD.2023-0292
      摘要:LCD背光的色彩转换包括蓝光激发YAG黄粉、蓝光激发β-SiAlON+KSF红粉、蓝光激发红绿量子点材料等3种方式。在数字调光模式下,3种色彩转换方案在不同电流占空比条件下的亮度变化趋势基本呈线性关系,但色坐标变化趋势差异明显。随着电流的变化,蓝光激发β-SiAlON+KSF红粉转换方案样品在3种样品中色坐标变化差异值最大,且红色变化比绿色明显。蓝光激发红绿量子点转换方案的色坐标变化介于其他两种方案之间,且绿色变化比红色明显。经分析,色坐标变化差异与红绿粉的量子激发效率差异有关。通过缩短KSF粉余辉时间及驱动电流调光周期可以消除“红爆”现象。  
      关键词:色彩转换;色坐标;调光电流;光致发光;余辉   
      261
      |
      124
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 42811697 false
      发布时间:2024-07-28
    • [{"title":"基于哈特曼探测器的光波相位三维显示方法","chapter":"1 引言","content":"夏克-哈特曼波前探测器是一种由微透镜阵列和CCD相机组成的光学测量设备[1],具有结构简单、操作简便、抗干扰能力强等优点,在自适应光学领域有广泛应用[2-8]。近年来,哈特曼探测器还广泛应用于大气湍流测量、眼科应用和光学检测等领域。在大气湍流测量方面,哈特曼探测器用于测量大气湍流的大气相干长度、格林伍德频率等参数,为大气湍流强度的评估提供支撑数据[9-13]。在眼科应用中,哈特曼波前探测器能够实时探测人眼像差,进而通过波前校正器进行像差校正,以实现高分辨率视网膜成像[14-15]。其还用于人眼像差的测量,通过求解Zernike多项式以探测人眼高阶像差[16-17]。在光学检测领域,哈特曼探测器可以用于大口径平面镜面形的高精度检测[18],还广泛应用于光学元件的像差检测,能测量同一镜片不同区域的波前像差以及相同区域不同镜片的波前像差[19-20]。综上所述,目前哈特曼探测器主要应用在不同领域实现像差探测和大气湍流参数测量。为此,本文拟进一步拓宽其应用领域,以期利用哈特曼探测器的波前探测功能,实现光的相位的三维立体显示。光是一种电磁波,具有振幅和相位。一般而言,其振幅比较容易测量和观测,因为人眼和各种探测器都是振幅敏感型器件。但是,光的相位却无法直接观测,这极大地影响了人们对光的全面认识和理解。迈克尔逊干涉仪等基于双光束干涉的方法,虽然可以采用干涉条纹展示光的相位分布,但是极易受到振动等环境的干扰,对实验条件要求苛刻,且成本较高。本文基于哈特曼探测器可以对光束进行相位测量且对振动环境不敏感的特点,研究实现光波相位的三维显示方法并研制出相位三维显示系统,实现光的相位的三维显示,便于研究者直观观测光的相位分布。","result":"夏克-哈特曼波前探测器在自适应光学、大气湍流测量、眼科应用和光学检测等领域有广泛应用。其在大气湍流测量中用于评估大气湍流强度,在眼科中用于高分辨率视网膜成像和人眼像差测量,在光学检测中用于高精度检测和像差检测。本文旨在利用哈特曼探测器的波前探测功能,研究光波相位的三维显示方法,以实现光相位的直观观测。","language":"zh"},{"title":"基于哈特曼探测器的光波相位三维显示方法","chapter":"2 哈特曼探测器的相位探测能力","content":"2.1 哈特曼探测器的工作原理哈特曼探测器是由CCD相机和微透镜阵列组成的光学测量设备。微透镜阵列由N×N个大小相同的微透镜构成。每个微透镜把不同区域光波会聚在焦平面上,形成光斑阵列,由CCD相机进行探测。平面波入射时,在焦平面上形成分布均匀的光斑;当波面发生畸变时,焦平面上的光斑会偏离中心位置,如图1所示。假设平行光入射时,参考质心的坐标为(Xc0,Yc0);待测波面入射时,根据单个微透镜光斑质心位置(Xc,Yc)可以计算出光斑质心在X和Y方向上的偏移:,。图 1单个子孔径光斑的质心计算示意图Fig.1Schematic diagram of single subaperture spot centroid calculation单个微透镜子孔径对应局部波前X方向和Y方向上的斜率分别为SX和SY: ,(1) ,(2)其中:Φ为波前相位,f0为微透镜焦距。因此,根据质心偏移量便可以求出入射到各个微透镜的波前斜率。根据测量得到的波前斜率,可以利用Zernike多项式的模式法重构波前[21]。此时,其波前如式(3)所示: ,(3)其中:ak是Zernike多项式系数,Zk(x,y)为第k项Zernike。Zernike多项式的系数可由式(4)求解[21]: .(4)Q中的元素为Zernike在波前探测器子孔径位置上的导数。把求得的Zernike多项式系数ak代入公式(3)即可获得被测光束的相位分布。此外,Zernike多项式每一项的系数都代表一种像差,如a3为离焦量系数,a4为X向初级像散项系数,a5为Y向初级像散项系数。2.2 屈光不正探测能力为了便于理解,本文采用生活中常见的屈光不正矫正眼镜来改变光束的相位分布并进行三维显示。屈光不正眼镜有近视镜、远视镜和散光镜,下边分别分析哈特曼探测器针对屈光不正的探测能力。动态范围θmax是指微透镜作为波前传感器时,能够测量的最大角度偏移量: ,(5)其中,d是微透镜的直径。θmax 对应微透镜焦平面上光斑的最大偏移量δymax。哈特曼探测器能够测量的最大倾斜量δz为: .(6)其中,D为微透镜阵列的口径,由哈特曼探测器的孔径所决定。能够测量的最大球冠高度hmax近似等于最大倾斜量δz的1/2。2.3 球面波屈光度的测量方法为了更加深刻地认识和理解光的相位特性,在进行相位三维显示的同时,给出被测镜的屈光不正度数。根据离焦量系数计算哈特曼探测器探测到的波前球冠高度h: .(7)则光波的曲率半径R为: .(8)经过近视镜形成的球面波在传播过程中会不断扩散,a3为正数;而经过远视镜形成的球面波在传播过程中会不断收缩,a3为负数。如图2所示,若测量镜片为近视镜,哈特曼波前探测器探测到的球面波和平行光束经过近视镜产生的球面波的曲率半径不同,二者相差S,即哈特曼探测器的微透镜阵列到眼镜之间的距离。因此,眼镜的焦距计算公式如式(9)所示: .(9)图2镜片对光束传输的影响示意图。(a)近视镜;(b)远视镜。Fig.2Influence of glasses on beam transmission. (a) Myopic glasses; (b) Presbyopic glasses.则眼镜的屈光度为: .(10)2.4 柱面波屈光度的测量方法当使用散光镜演示像散的三维显示时,通过Zernike多项式系数中获得的离焦量以及X和Y两个方向的像散量,哈特曼探测器处探测到的屈光度为和[22-23]: ,(11) .(12)考虑到柱面波在传播过程中也会出现扩散或收缩,计算曲率半径: ,(13) .(14)结合距离进行修正: ,(15) .(16)结合微透镜阵列的口径得到相应的X和Y两个方向的屈光度JX和JY: ,(17) .(18)柱面波屈光度φ2为: .(19)则眼镜的屈光度为: .(20)","result":"详细阐述了哈特曼探测器的工作原理,包括其由CCD相机和微透镜阵列构成的光学测量设备,以及如何通过微透镜阵列形成的光斑阵列来探测光波相位。介绍了如何利用质心偏移量计算波前斜率,并使用Zernike多项式模式法重构波前,进而获得光束的相位分布。此外,还探讨了哈特曼探测器对屈光不正的探测能力,包括动态范围、最大倾斜量和球冠高度的测量,以及如何通过离焦量系数计算波前球冠高度和光波的曲率半径。最后,描述了测量近视镜和远视镜形成的球面波屈光度的方法,以及使用散光镜时如何通过Zernike多项式系数测量柱面波屈光度。","language":"zh"},{"title":"基于哈特曼探测器的光波相位三维显示方法","chapter":"3 相位三维显示系统光路设计","content":"为了实现光波相位的三维立体显示,整体光路结构如图3所示,主要包括点光源、准直系统、屈光矫正镜、哈特曼探测器和控制计算机。半导体激光器波长为635 nm,连接到发散角度为12.7°的光纤,作为点光源。点光源发出球面波,经准直透镜形成平行光束,通过孔径光阑改变光束直径;该有效光束经过镜片后光波相位发生改变,然后入射到哈特曼探测器上;经哈特曼探测器进行波前探测,并在计算机上显示镜片的屈光不正程度以及光波相位的三维显示图和二维干涉图。图3光波相位三维显示系统原理图Fig.3Schematic diagram of a three-dimensional display system of optical phase基于该设计光路,利用Zemax光学设计软件,进行具体元件设计及整体光路仿真,如图4所示。在未加屈光矫正镜的情况下,仿真结果如图5(a)所示,可以看出波前为平面波。近视镜对波前相位分布的改变如图5(b)所示,波前为内凹的球面波。远视镜对波前相位分布的改变如图5(c)所示,波前为外凸的球面波。不同波面对应不同的相位显示状态。图4光波相位三维显示系统仿真示意图Fig.4Simulation of the three-dimensional display system of optical phase图5相位三维显示仿真结果。(a)原始光路;(b)近视镜;(c)远视镜。Fig.5Results of the three-dimensional phase display system. (a) Original phase distribution (b) Myopic glasses and (c) Presbyopic glasses.","result":"介绍了基于哈特曼探测器的光波相位三维显示系统的光路设计。系统由点光源、准直系统、屈光矫正镜、哈特曼探测器和控制计算机组成。使用635 nm波长的半导体激光器作为点光源,通过准直透镜形成平行光束,经屈光矫正镜后,光波相位改变并被哈特曼探测器探测。利用Zemax软件进行元件设计和光路仿真,展示了不同屈光矫正镜对波前相位分布的影响,包括平面波、内凹球面波和外凸球面波,以及相应的相位显示状态。","language":"zh"},{"title":"基于哈特曼探测器的光波相位三维显示方法","chapter":"4 相位三维显示实验","content":"4.1 实验系统本实验使用的哈特曼探测器的主要技术参数如表1所示。选择使用近视镜、远视镜和散光镜作为屈光矫正镜,改变光波的波前相位。哈特曼探测器微透镜直径d=0.4 mm,根据式(5)可得θmax=0.033 rad。已知微透镜阵列口径D=6.8 mm,带入公式(6)可得δz=227 μm,则hmax=114 μm。最后,根据式(7)~式(8),在未考虑距离影响的情况下,可以计算出哈特曼探测器的球面镜测量范围为0.00~4.90 D。眼镜与哈特曼探测器的距离为S=10 cm,考虑到距离的影响,根据式(9)~式(10),经过近视镜后球面波会扩散,近视镜的测量范围为0.00~9.61 D。光波经过远视镜后球面波会收缩,远视镜的测量范围为0.00~3.29 D。实验中,我们选用-2.00 D的近视镜和1.00 D远视镜进行测量。表1哈特曼探测器主要参数Tab.1Main parameters of Hartmann detector根据式(11)~式(19)和表1中的数据可以计算出哈特曼探测器的柱面镜测量范围为0.00~5.40 D,本文选用0.50 D的散光镜进行测量。搭建的实验光路如图6所示。激光经光纤形成点光源,通过准直透镜形成平面波,可调光阑限制平行光束直径,去掉外围杂散程度较高的部分。最后,经过屈光矫正镜,入射到哈特曼探测器。图6屈光镜测量实验图Fig.6Experimental diagram of measuring lens为了抑制杂光及灰尘的影响,保证系统密闭性,同时为了在不同地方测量并演示,设计了光波相位实验系统的外壳,如图7所示。为方便被测镜片的更换,在光波相位实验系统外壳的中心处设计通光孔和干板夹固定装置的开孔。光源和图7显示的系统连接显示器可以实现相位的三维显示和测量。图7光路及外壳系统图Fig.7System diagram for optical path and outer cover4.2 实验结果准直系统发出的平行光束受到系统装调精度、环境扰动以及哈特曼探测器对准精度的影响,光束会产生倾斜、离焦和像散等像差。为了消除像差的影响,首先在不放置矫正镜片时,利用哈特曼探测器测量系统像差,如图8(a)所示。利用哈特曼探测器的相对测量功能进行系统像差的修正。此时,波前近似为理想的平面波,如图8(b)所示。在系统光路中放入不同类型的镜片,利用控制软件测量波前相位分布并实现三维显示。图8相对测量前后的二维干涉图。(a)未修正;(b)已修正。Fig.8Two dimensional interferogram before and after relative measurement. (a) Uncorrected; (b) Corrected.首先放入近视镜片,测量结果如图9所示。为了更直观地显示光波的相位分布,通过程序实现二维干涉条纹图和三维立体显示图,展现光波的波前相位。可以看出,利用控制软件可以形象直观地显示光的相位分布,且可以通过控制鼠标实现不同角度的光波相位展示。平面波经过近视镜后被发散成球面波,因此立体显示的波前相位分布呈凹陷的半球形。图9近视镜测量结果。(a)二维干涉图;(b)视角1;(c)视角2;(d)视角3。Fig.9Myopic lens measurement results.(a) Two-dimensional pattern; (b) Perspective 1; (c) Perspective 2; (d) Perspective 3.其次,放入远视镜片,测量结果如图10所示。平面波经过远视镜后被会聚,因此立体显示的波前相位分布呈突起的半球形。图10远视镜测量结果。(a)二维干涉条纹图;(b)三维显示图。Fig.10Results of hyperscopic measurements. (a) Two-dimensional diagram; (b) Three-dimensional pattern.最后,放入散光镜片,测量结果如图11所示。平面波经过散光镜后像散量发生改变,立体显示的波前相位分布呈马鞍形。图11散光镜测量结果。(a)二维干涉条纹图;(b)三维显示图。Fig.11Results of the astigmatic measurements. (a) Two-dimensional diagram; (b) Three-dimensional pattern.根据球面镜和柱面镜的屈光不正测量方法对不同屈光镜进行测量,测量结果如图12所示。可以看出,测量结果和镜片本身的度数基本一致,说明本文的测量方法有效。测量度数的误差是由于哈特曼探测器和屈光矫正镜的距离S不精确引起的,进行更为精确的测量可以减小误差。图12屈光矫正镜测量结果Fig.12Dioptric measurements","result":"详细描述了基于哈特曼探测器的光波相位三维显示方法的实验系统和结果。实验系统包括哈特曼探测器、屈光矫正镜、激光源、准直透镜、可调光阑等,以及为保证系统密闭性和方便测量设计的外壳。实验中,通过哈特曼探测器测量了不同类型镜片对光波相位的影响,包括近视镜、远视镜和散光镜。实验结果表明,通过控制软件,可以直观地显示光波的相位分布,并实现不同角度的三维展示。例如,近视镜使光波发散成球面波,远视镜使光波会聚,散光镜导致像散量改变。此外,通过球面镜和柱面镜的屈光不正测量方法,验证了测量方法的有效性,测量结果与镜片度数基本一致,误差主要来源于探测器和矫正镜的距离不精确。","language":"zh"},{"title":"基于哈特曼探测器的光波相位三维显示方法","chapter":"5 结论","content":"本文基于哈特曼探测器的波前探测功能,实现了光波相位的三维立体显示。首先,分析哈特曼探测器的相位测量能力,并通过求解Zernike多项式系数的方式设计屈光不正计算方法。然后,选取合适的光源,进行实验系统的整体设计,并使用Zemax软件进行测量系统性能仿真。根据使用的哈特曼探测器参数,获得此系统球面波测量范围为0.00~4.90 D,柱面波测量范围为0.00~5.40 D。通过程序控制进行系统像差的扣除,实现相对测量,进一步提高哈特曼探测器对环境的适应能力。通过对已知屈光度的3种矫正镜:近视镜、远视镜和散光镜进行测量,显示出不同的二维图和三维图,同时测量出屈光不正度。此方法能快速测量并显示三维光波相位,方便研究者直观观测光波相位分布。基于哈特曼探测器设计的相位三维实验系统,拓宽了哈特曼探测器的应用范围,具有更好的环境适应能力。","result":"通过哈特曼探测器实现光波相位三维立体显示,分析了探测器的相位测量能力,设计了屈光不正计算方法,进行了实验系统设计和性能仿真。系统可测量球面波和柱面波,通过程序控制扣除像差,提高环境适应性。实验测量了矫正镜的屈光度,展示了二维和三维图,快速直观地显示光波相位分布,拓展了哈特曼探测器的应用范围。","language":"zh"}]
      徐雷,陆欣怡,李静妮,孙会娟,樊丽娜,陆焕钧,毛红敏,曹召良
      2023, 38(12): 1681-1688. DOI: 10.37188/CJLCD.2023-0300
      摘要:相位是描述光波状态的重要参数,但却无法直接观察。本文基于哈特曼探测器的波前快速探测功能,研究了光波相位三维显示的方法,并研制出相位三维显示系统。首先,利用Zemax软件对系统的光源、准直透镜等光学参数进行优化设计;然后,基于模式法波前重构理论,根据探测的Zernike多项式离焦量和像散项系数,实现了对3个不同类型镜片的相位三维显示,并给出相应屈光度的测量方法;最后,实验验证了光波相位的三维显示和屈光度测量的有效性,-2.00 D的近视镜测量值为-2.07 D,1.00 D的远视镜测量值为0.91 D,0.50 D的散光镜测量值为0.56 D。实验结果表明,此系统能够较准确地测量屈光矫正镜的屈光度,并实现相位的三维显示。本文设计的基于哈特曼探测器的相位三维显示方法具有更好的环境适应能力,便于研究者直观观测光的相位分布。  
      关键词:哈特曼探测器;光波相位;三维显示;屈光不正   
      65
      |
      82
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 43464591 false
      发布时间:2024-07-28

      图像处理

    • [{"title":"基于改进SIFT和互信息法的单色和彩色视频高精度配准","chapter":"1 引言","content":"本文主要探讨了对具有时间差波动的单色视频和彩色视频进行高精度配准的优化方法。近年来在监控安防中越来越多地使用双目相机作为视频采集设备,但双目相机之间存在微小且时而变化的时间差,并且摄像头时常进行摆头运动,若采用相同的配准矩阵对视频进行配准则所采集的视频会出现不可控的配准差异。这种配准差异虽然在人为观测时产生的影响较小但在使用机器学习等算法进行后续处理时则会产生较大影响。因此,需要针对这种不确定性时差波动进行进一步优化,以提高视频配准的准确性。有许多学者在图像配准领域中做出了贡献。其中,按照配准图像和待配准图像之间的关系,图像配准可分为同源图像和异源图像配准;按照配准所使用的方式,图像配准可分为传统方式和深度学习方式。近年来关于配准的研究有些采用了传统方法,如粒子群算法、蚁群算法和蜂群算法等[1]。另外,研究者也通过特征点的提取来进行图像配准。红外图像和可见光图像的配准方式被分为了互信息、特征提取和深度学习等3种大类[2-5]。一些方法使用图像位置信息和仿射中心不变性来提高无人机视频配准效果[6],而其他方法使用注意力机制[7]、轨迹预测[8]、特征点优化[9-12]、关键部位定位[13-15]等方式对配准进行优化。一些研究者还使用了监督[15-17]和无监督[18]深度学习模型直接生成变换矩阵的方式简化配准过程,使用多尺度的方式提高配准速度[19],使用归一化的方式提高配准准确度[20],或在简单场景中简化配准过程以大幅提高配准速度[20-21]。有些研究者使用Moravec角点检测和SIFT特征提取相结合的方式[22],或将图像分为高频子带和低频子带来提高配准精度[23],也有通过提取共性特征配准电站图像[24],还有一些研究者采用了人脸识别框的方式来加强鼻子位置的匹配准确率[25]。Zuo C综述了各种图像计量方法,为图像质量整理了各种评价指标[26]。包含可见光波段和近红外波段的单色视频和彩色视频具有相似但不完全相同的特征属性,仅使用互相关信息进行模板配准无法完成空间角度的变换,而使用特征尺度不变性进行配准则无法达到高精度配准的目的和要求,因而包含可见光波段和近红外波段的单色视频和彩色视频的高精度配准工作仍然需要进行进一步的探讨。由于视频流同时具有时序信息和空间信息,时序信息也可以作为视频配准的一大助力,但视频时序信息存在不确定性波动。目前常采用的同步触发机制可有效消除双目相机之间跨时间戳的时序误差,因此无需进行基于时间同步方法的时序修正,但仍存在小于帧间时间差的时间误差。对于小于帧间时间差的时序误差,使用现有时间同步方法不能有效进行修正,因而需要针对这种不确定性时差波动进行进一步优化。本文的主要工作是针对这种具有时间差波动的单色视频和彩色视频提出高精度配准优化方法。首先使用尺度不变特征变换的方式对视频进行粗匹配,随后使用缩小互相关信息和通过金字塔模式修正配准矩阵的方式对视频进行配准再修正,并且基于视频帧的前后相似性对尺度不变特征变换中的特征点选择进行筛选,提高了单色视频和彩色视频的配准准确率,最终在公开数据集MICVV上进行了测试,证实了算法的有效性。","result":"探讨了针对存在时间差波动的单色和彩色视频的高精度配准优化方法。在监控安防领域,双目相机的微小时间差和摆头运动导致视频配准差异,影响机器学习等算法的后续处理。图像配准可分为同源和异源图像配准,传统和深度学习方法。研究者通过特征点提取、图像位置信息、仿射中心不变性、注意力机制、轨迹预测、特征点优化、关键部位定位等方法优化配准。监督和无监督深度学习模型也被用于简化配准过程,提高速度和准确度。本文提出的方法首先使用尺度不变特征变换进行粗匹配,然后通过缩小互相关信息和金字塔模式修正配准矩阵,基于视频帧前后相似性筛选特征点,提高配准准确率。在MICVV数据集上的测试验证了算法的有效性。","language":"zh"},{"title":"基于改进SIFT和互信息法的单色和彩色视频高精度配准","chapter":"2 单色视频和彩色视频的配准工作原理与改进","content":"2.1 SIFT算法配准原理尺度不变特征变换(Scale-invariant feature transform,SIFT)算法分为4个步骤:尺度空间特征点检测、定位特征点、确定特征点方向和特征点描述。SIFT算法首先需要在图像中寻找特征点,在SIFT中采用高斯核计算的方式对图像描述不同的尺度。通过尺度因子建立尺度空间,在其尺度空间内检测极值点,也就是特征点。SIFT算法需要对特征点进行定位。为了还原这些特征点原有的大小和方向,需要对这些离散的特征点进行平滑拟合,最终得到真正的特征点属性。SIFT算法需要确定特征点方向。SIFT在确定特征点方向时采用了梯度直方图的统计方法,统计了特征点附近一块区域的梯度方向,并采用最大方向为当前特征点的主方向。SIFT算法需要对特征点进行描述,通过建立矢量矩阵的方式描述特征点的各区域方向属性。首先将所有特征点的邻域像素根据特征点的主方向旋转至同一方向,并将特征点的邻域像素分为4块,对4块区域分别统计方向直方图,最终得到消除亮度和特征点旋转影响的特征点描述符。取得特征点描述后,SIFT算法一般采用RANSAC算法进行特征点的匹配,计算配准矩阵。2.2 本文算法对于首帧配准,考虑到其配准精度会直接影响后续帧配准精度,本文算法的首要目标是提高首帧配准精度;对于后续帧配准,考虑到视频时序长带来的时间成本,本文算法着力于在保持高配准精度的情况下提高后续帧配准速度。2.2.1 基于改进SIFT方法的视频首帧粗配准针对单色视频和彩色视频的配准问题,本文在SIFT基础上进行了改进。由于使用双目相机进行视频采集时相机相对位置固定,时间差和硬件抖动带来的配准误差保持在一定范围内,因而可利用标记点对计算出的参考配准矩阵对RANSAC计算出的特征点对进行筛选,以增强算法稳定性。在使用双目相机进行监控视频拍摄时,由于相机的镜头中轴线间距较小而所拍摄景物均与相机距离较远,所产生的空间变化不足以影响SIFT算法对特征点的描述,因此可使用透射变换矩阵作为配准矩阵。由于透射变换矩阵具有较高的自由度,使配准算法能够适应微小的空间变化,但需要充分的特征点对才能对矩阵进行精确推导。同时,为了避免误删有效特征点对,应有足够的备选特征点对以供筛选。由于单色视频和彩色视频中相同位置的特征点对常具有完全不同的方向特征,且在双目相机拍摄的监控视频配准问题上方向波动较弱,使用8或16个方向判断对提高配准质量没有明显帮助。对于SIFT算法来说,小于5°的方向误差对特征点搜索影响较小可以忽略,因此取消方向搜索不会降低算法敏感性,反而可以通过减少约束条件,增加特征点对的数量,对于具有后续筛选的配准算法具有很大益处。因而本文将SIFT算法中特征点搜索方向数量由8个减少到1个,即不考虑特征点方向,进而确保在每张图像中寻找出100个以上特征点对。为了取得更为稳定的参考配准矩阵,分别在图像的4个象限各选取一个标记点,参考配准矩阵和标记点对的关系如式(1)所示: ,(1)其中:表示在单色图像中标记点的横坐标,表示在单色图像中标记点的纵坐标,表示在彩色图像中标记点的横坐标,表示在彩色图像中标记点的纵坐标,由参数a1~a4、b1、b2、c1、c2、w(归一化系数一般设置为1)组成的3×3矩阵是配准矩阵。利用4个标记点对联立式(1)可求得参考配准矩阵。由于相机的相对位置固定,可利用参考配准矩阵粗略预测单色视频首帧中特征点在彩色视频首帧中的对应配准点位置,并与RANSAC计算出的匹配特征点对比计算误差,删除误差大于设定阈值Dmax的特征点对,提高配准的稳定性。本文采用式(2)计算其中特征点对误差: ,(2)其中:x和y分别是特征点(x1, y1)通过参考配准矩阵预测得到的配准点坐标,(x2, y2)是RANSAC计算出的匹配特征点坐标。2.2.2 视频首帧的配准优化经过本文提出的改进SIFT方法进行配准后,仍存在一定的配准误差。由于在视频中首帧配准精度往往对后续帧配准精度影响很大,因而需要对首帧粗配准结果进一步修正。本文采用互相关信息法进行首帧配准的进一步配准优化,通过微调变换矩阵修正配准点位置,SIFT算法计算出的变换矩阵及其修正如式(3)所示: ,(3)其中,、、和为修正参数。本文设计了一种步长金字塔模式,即通过多轮调节、逐步减小步长对修正参数进行调节,提高配准精确度。首先将修正过程分为t个调节轮次,每个轮次按照修正步长dLt对修正参数L1~L4进行修正,通过逐渐减小dLt的方式逐轮提高修正精度。其中在第t轮次中的修正方式为:对L1~L4逐个进行加或减运算以及包括原点共计算出9个方向对应的配准矩阵,并根据这9个配准矩阵得到9张配准图像,通过与参考图像进行均方误差(Mean-square error,MSE)计算得到9个数值,根据所得MSE最小的调整方向对修正参数进行调整,连续执行第t轮10次或最小方向为原点时进入下一轮次。各轮次中修正步长dLt的计算公式如式(4)所示: ,(4)其中:u是缩小系数,根据经验可知其数值不宜过小且应在0.7~1之间,若过于接近0.5则容易陷入局部最优解;t是调节轮次;dL0是初始修正步长。为了保证初始修正步长足够大,使用式(5)计算最小步长dL0: ,(5)其中:a1~a4为式(3)中的待调整参数,n是图像长边长度。在经过t轮修正后,若修正步长小于最小修正步长mindL则认为达到配准目标。为了满足配准精度,采用式(6)确定最小修正步长mindL: .(6)2.2.3 后续视频帧平移修正由于视频具有时序长、运算量大等特点,视频的后续视频帧配准问题主要集中在配准速度和算法稳定性上。经过本文提出的改进SIFT算法进行配准有效提高了配准精度。然而,在配准速度上,由于使用了SIFT特征配准耗费了大量时间,因而需要使用新的方法对后续视频帧的配准速度进行优化。若使用前帧相同的配准矩阵对后续的视频帧进行配准变换,则由于单色视频与彩色视频中存在的时间差波动以及相机的摆动,随着相机的摆动,时间差的波动会导致原本应匹配的一对视频帧常出现一定程度的平移误差,因而需要对后续帧进行进一步修正。本文采用缩小互相关信息的方式进行后续帧的平移修正,通过对待配准视频帧进行平移变换的方式弥补由时间差波动和相机摆动带来的平移误差。平移变换中的坐标换算如式(7)所示: ,(7)其中:x和y分别是(x2, y2)经过平移修正后的横坐标和纵坐标,为方向上的平移距离,y为方向上的平移距离。和y的修正方式仍然采用本文设计的步长金字塔模式。首先将修正过程分为t个调节轮次,每个轮次按照修正步长dLt对修正参数dx和dy进行修正,通过逐渐减小dLt的方式逐轮提高修正精度。其中在第t个轮次中的修正方式为:对dx和dy逐个进行加或减运算以及包括原点共计算出5个方向对应的配准矩阵,并根据这5个配准矩阵得到5张配准图像,通过与参考图像进行均方误差(Mean-square error,MSE)计算得到5个数值,根据所得MSE最小的调整方向对修正参数进行调整,连续执行第t轮10次或最小方向为原点时进入下一轮次。在经过t轮修正后,若修正步长小于最小修正步长mindL则认为达到配准目标,即配准过程中标记点误差小于0.01像素。","result":"详细介绍了单色视频和彩色视频的高精度配准方法,包括SIFT算法的配准原理和本文提出的改进措施。SIFT算法通过尺度空间特征点检测、定位、方向确定和描述来实现图像特征点的匹配,通常使用RANSAC算法计算配准矩阵。本文算法特别关注首帧配准精度,因为其直接影响后续帧的配准效果。为此,本文在SIFT基础上进行了改进,利用标记点筛选特征点对,采用透射变换矩阵作为配准矩阵,并简化了特征点方向的搜索,以提高算法的稳定性和特征点对的数量。\n\n为了进一步提高首帧配准的精度,本文采用互相关信息法对粗配准结果进行优化,通过微调变换矩阵修正配准点位置,并设计了步长金字塔模式逐步提高修正精度。此外,针对视频时序长带来的时间成本问题,本文提出了一种缩小互相关信息的方式进行后续帧的平移修正,以弥补时间差波动和相机摆动带来的平移误差,同样采用步长金字塔模式进行参数修正,直至达到配准目标。\n\n总体而言,本文提出的基于改进SIFT和互信息法的视频配准方法,通过优化首帧配准和后续帧平移修正,实现了单色和彩色视频的高精度配准,既保证了配准精度,又提高了配准速度。","language":"zh"},{"title":"基于改进SIFT和互信息法的单色和彩色视频高精度配准","chapter":"3 配准效果与结果","content":"为了验证本文算法的可行性和有效性,在公开数据集MICVV上进行了仿真实验,通过定性分析和定量分析进行了效果验证。3.1 MICVV数据集MICVV数据集包含多种配准和未配准的连续视频帧,其中单色视频为包含可见光波段和近红外波段的视频,彩色视频为包含可见光波段的同场景视频。视频场景主要为校园监控场景,单色和彩色视频帧图像尺寸均为640×480,视频帧率均为15 fps。3.2 视频首帧粗配准方法验证实验为了验证2.2.1节中视频首帧粗配准方法的有效性,针对单色视频和彩色视频的首帧分别使用传统SIFT算法和改进SIFT算法计算了配准点对,配准效果如图1所示。图1配准效果及改进后的配准效果。(a)单色视频帧;(b)彩色视频帧;(c)原始RANSAC效果;(d)改进后的配准效果。Fig.1Registration effect and improved registration effect. (a) Monochrome video frames; (b) Color video frames; (c) Original RANSAC effect; (d) Improved registration effect.根据图1可知:(1)筛选后仍然保留了大量的配准点对,足以根据筛选后的配准点对计算配准矩阵;(2)筛选掉了大量不正确的配准点对,为配准计算增加了稳定性。配准点分布情况表明了2.2.1节中视频首帧粗匹配方法有效,在保留大量正确配准点对的情况下有效消减了错误配准点对的数量,提高了算法的稳定性。3.3 视频首帧配准改进方法验证实验为了验证本文提出的视频首帧配准方法的有效性,对经过传统SIFT算法得到的首帧配准图像和在改进SIFT方法基础上进一步配准优化后得到的首帧配准图像进行了比较,并通过对配准图像进行棋盘化处理更精确分析配准误差,最后对能够看出配准差异的局部区域予以放大展示,结果如图2所示。图2传统SIFT方法与本文首帧配准方法效果对比。(a)单色视频帧;(b)彩色视频帧;(c)SIFT配准后单色图像;(d)进一步配准优化后的单色图像;(e)SIFT配准后的棋盘配准图;(f)进一步配准优化后的棋盘配准图;(g)具有1像素误差的局部区域;(h)修正后误差几乎不可见素的局部区域。经过进一步配准优化后,图像两侧位置更加精确,标记点误差由1像素缩小到不可察。Fig.2Comparison of the effect of traditional SIFT method and the first frame alignment method in this paper. (a) Monochrome video frames; (b) Color video frames; (c) Registered monochrome images obtained by the improved method; (d) Monochrome images after further alignment optimization; (e) Board alignment chart after SIFT alignment; (f) Further alignment-optimized board alignment diagram; (g) Local area with 1 pixel error; (h) Error is barely visible in the local area of the vegetation after correction. After further alignment optimization, the position is more accurate on both sides of the image, and the marker point error is reduced from 1 pixel to almost invisible.经过计算得到,使用SIFT算法进行配准的耗时为2.628 s,使用改进SIFT算法进行配准的耗时为2.463 s,进一步使用高精度修正方法进行配准时间增加到了4.163 s。使用SIFT方法所得首帧配准图像的有效区域(非黑色边缘区域)MSE为0.011 46,使用本文视频首帧配准(改进SIFT方法加高精度修正)方法所得首帧配准图像的MSE为0.011 37,即MSE减少了0.79%。从图2中的棋盘配准图可以看出,使用传统SIFT方法所得到的配准图像标记点误差约为1像素,而使用本文首帧配准方法后的标记点误差则不可察。3.4 视频后续帧的配准实验针对序列长度为100帧的单色视频和彩色视频进行了配准实验,其中视频首帧配准采用2.2.1和2.2.2节中所提出的方法,后续视频帧采用了2.2.3节中所提出的方法,并对配准结果进行了定性和定量分析。对于定性分析,从上述视频帧中提取了第14、28、42、56、70、84、98共7个视频帧进行了对比分析,结果如图3所示,其中每一帧包括了对应的单色视频帧、彩色视频帧、配准后的单色视频帧以及棋盘配准效果展示图。图3连续视频帧的配准效果,从上到下依次为第14、28、42、56、70、84、98帧图像的对比图。(a)单色视频帧;(b)彩色视频帧;(c)配准后的单色视频帧;(d)棋盘配准图。Fig.3Registration effect of continuous video frames. (a) Monochrome video frames; (b) Color video frames; (c) Monochrome video frames with registration; (d) Chess and card registration map.根据图3中的棋盘配准图可以看出,使用本文算法进行配准时,后续帧的标记点误差几乎不存在,且对不同时序帧均保持良好的配准效果,说明本文算法能够有效并高精度地完成单色视频和彩色视频的配准工作,同时具有时间上的稳定性。对于定量分析,分别使用了本文算法和SIFT算法对上述的长度为100帧的单色视频和彩色视频的配准效果进行了数字统计,所使用的单色视频和彩色视频尺寸均为640×480,统计包含上述视频7个视频帧的各项指标和1~100帧的各项指标平均值,其中包括有效区域均方根误差(MSE)、配准平均时间、结构相似性(SSIM)、峰值信噪比(PSNR)。MSE计算了配准图像与待配准图像的L2距离,SSIM在多尺度上计算了配准图像与待配准图像的配准质量,PSNR通过归一化的衡量方法对配准效果进行了评价。实验数据如表1所示。表1连续视频帧的配准结果Tab.1Registration result of continuous video frames从表1可以看出,本文算法和SIFT算法在MSE、SSIM和PSNR等配准精度指标上差异不大,但SIFT算法在第84帧配准结果出现了较大的误差,MSE误差、SSIM和PSNR分别达到了0.033 1、0.520和14.002,算法稳定性略低。本文算法在整个视频序列配准中一直能够正常工作,没有出现明显的误差起伏,算法稳定性较好。在英特尔酷睿i5-10210U(1.60 GHz)上对100张连续图像配准时,本文的平均配准时间为0.357 s,而使用SIFT算法的平均配准时间为2.373,使用本文算法大幅缩短了配准时间。综上所述,本文算法在连续视频帧的配准工作中精度较高、速度较快且稳定性较强,相比SIFT算法更加稳定,在大幅提高配准速度的同时配准精度波动较小且具有较高的稳定性,符合单色视频帧和彩色视频帧的高速和高精度配准要求。","result":"通过在MICVV公开数据集上进行仿真实验,对论文提出的基于改进SIFT和互信息法的单色和彩色视频配准算法进行了验证。实验包括定性分析和定量分析,涉及单色和彩色视频的首帧粗配准方法、首帧配准改进方法以及视频后续帧的配准实验。\n\n在首帧粗配准方法验证实验中,使用传统SIFT算法和改进SIFT算法计算配准点对,结果表明改进方法在保留正确配准点对的同时,有效减少了错误点对,提高了算法稳定性。\n\n首帧配准改进方法验证实验中,对传统SIFT算法和本文方法得到的首帧配准图像进行了比较。进一步配准优化后,图像位置更精确,标记点误差由1像素缩小到几乎不可见。本文方法在配准时间和MSE上均优于SIFT算法。\n\n视频后续帧的配准实验中,本文算法在100帧单色和彩色视频上进行了配准,定性分析显示配准效果良好,定量分析表明本文算法在MSE、SSIM和PSNR等指标上与SIFT算法差异不大,但稳定性更好。本文算法平均配准时间0.357秒,远低于SIFT算法的2.373秒。\n\n综上所述,本文算法在单色和彩色视频配准中表现出高精度、快速度和高稳定性,相比SIFT算法具有明显优势,满足了高速和高精度配准的要求。","language":"zh"},{"title":"基于改进SIFT和互信息法的单色和彩色视频高精度配准","chapter":"4 结论","content":"本文根据单色和彩色视频数据集配准工作精度高、速度快的要求,提出了基于预估配准矩阵进行改进的SIFT算法、适用于单色视频和彩色视频的高精度修正方法以及针对连续视频帧的平移修正的方法。通过定性分析实验证明了所提算法的有效性,并通过定量分析证明了所提算法的准确性和高效性。实验结果表明,相比于SIFT算法,本文算法首帧配准的MSE误差减少了0.79%,首帧的标记点误差由1像素减少到不可察,在连续视频帧中平均每帧配准时间为0.357 s,同时标记点误差仍然保持不可察,很好地满足了全自动化单色视频与彩色视频配准的要求。","result":"提出了一种改进的SIFT算法和互信息法,用于单色和彩色视频的高精度配准。通过预估配准矩阵和修正方法,实现了快速且准确的配准。实验结果表明,算法在减少MSE误差、提高标记点精度和降低配准时间方面均优于传统SIFT算法,满足了自动化视频配准的需求。","language":"zh"}]
      谢万鹏,刘欢,吴银花,陈雷,张岩,王文娜,胡佳,韩军
      2023, 38(12): 1689-1697. DOI: 10.37188/CJLCD.2023-0034
      摘要:为了解决单色视频和彩色视频的全自动高精度配准问题,设计了针对视频配准的首帧及后续帧配准方法,在保证配准速度的同时提高了配准精度。对于首帧,首先在尺度不变特征变换(SIFT)基础上,基于双摄像头的特点进行了改进,进而对单色视频和彩色视频进行了粗配准,增加了粗配准矩阵的获取稳定性和精确性;随后根据粗配准矩阵系数,使用尺度金字塔模式对单色视频和彩色视频的配准矩阵进行了配准修正。对于视频中的后续帧,采用具有步长金字塔的平移修正方法,对首帧中得到的修正配准矩阵进行再利用,并通过平移修正方法弥补了由不确定时差波动和相机摆动带来的平移误差,最终提高了单色视频和彩色视频的配准效率和配准精确度。实验结果表明,对于640×480大小的单色视频和彩色视频,本文算法相比传统SIFT算法将首帧配准均方根误差减少了0.79%,首帧标记点误差由约为1像素缩小到不可察,且连续视频帧的平均配准时间为0.357 s,同时仍然保持标记点误差不可察,较好地满足了单色视频和彩色视频配准的全自动、精度高、速度快、鲁棒性强等要求。  
      关键词:计算机视觉;视频配准;时空相似性;高精度修正   
      309
      |
      90
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 36012764 false
      发布时间:2024-07-28
    • [{"title":"基于改进YOLOv5s的手术器械检测与分割方法","chapter":"1 引言","content":"基于视觉的内窥镜手术作为一种具有代表性的微创手术,在深度学习[1-2]时代受到越来越多的关注。与传统的手术不同,微创手术在内窥镜相机的辅助下通过一个小的切口进行,组织缝合需要使用专业的手术器械。然而,缺乏对手术技巧、手术质量等有针对性的、客观的反馈是内窥镜手术过程中存在的关键问题之一。手术过程中手术器械检测与分割的准确性对评估外科医师的手术技能具有非常重要的意义[3]。国外针对手术器械检测与分割的研究相对较早,且近年来已有很多研究者将深度学习成功应用于实际内窥镜手术中。Jin等人[4]对手术过程中的手术器械进行检测,采用Faster-RCNN算法框架,主干网络使用VGG-16卷积神经网络,在内窥镜手术中实现了对手术器械的实时检测,可以辅助评估外科医师的操作技能。Mahmood等人[5]提出一种基于双流残差密集网络(DSRD-Net)的手术器械分割方法,利用残差和密集的空间金字塔池化模块优化算法,精准分割手术器械,减少因视野模糊等导致的人为失误,并在公开可用的胃肠内窥镜数据集上进行测试,取得了较好的实验结果。不过此类算法的参数量和运算量较大,如果再添加额外的优化模块,会导致检测和分割速度下降。基于此,文献[6]提出一种Anchor-free的卷积神经网络,通过沙漏网络对内窥镜手术视频进行逐帧检测并将手术器械建模,以点作为边界框的中心点生成检测框,在保证精度的同时,检测速度超过同时期以双阶段目标检测为代表的Anchor-based类算法。但是该网络只能生成手术器械的定位框而未实现对手术器械种类的识别,功能性上略有不足。国内对于深度学习在微创手术领域的研究起步较晚。2018年,郑腾辉等人[7]基于全卷积神经网络(FCN)实现了对手术器械和手术器械收纳盒的图像分割,识别目标的准确度可达到像素级,但是检测目标为手术器械收纳盒中的静态手术器械,因此实用性上有所欠缺。2019年,Ni等人[8]提出一种新的网络Residual Attention U-Net (RAUNet)用于白内障手术中的手术器械语义分割,该网络通过编码-解码结构获取高分辨率的掩膜,同时关注高阶和低阶特征图,从而在保证获取重要特征的基础上有效过滤干扰信息。2022年,Ni等人[9]为解决内窥镜手术中照明因素对手术器械的影响,提出了一种新的网络SurgiNet,通过添加金字塔注意力模块捕捉多尺度特征,通过自蒸馏消除其他的干扰信息。文献[10]提出一种改进的DoubleUNet[11]分割方法,通过对图像进行预处理,并使用密集连接空洞空间卷积池化金字塔(DenseASPP)模块[12]和Focal Tversky Loss损失函数进一步提取图像特征。该方法可以辅助外科医师切除结肠异常组织,从而降低息肉癌变的概率。综上所述,基于深度学习的手术器械检测与分割得到很多研究者的关注。虽然RAUNet网络已经考虑手术器械反光的问题,但在实际的内窥镜手术中,除手术器械金属材质自身导致的反光问题外,组织器官之间的相互遮挡、光线影响以及阴影遮挡等问题[13]也需要被考虑。文献[14]已经证实通过对YOLO算法的Neck部分的下采样进行优化和添加注意力机制,可以在保证模型轻量化的同时进一步提高检测的精度。但目前YOLO算法应用于内窥镜手术的研究相对较少,且目标检测中存在的漏检问题仍然有改进的空间。针对以上问题,本文提出一种改进的YOLOv5s手术器械检测与分割方法。对于内窥镜图像中存在的反光和阴影遮挡等问题,使用Gamma校正算法优化图像亮度和对比度。通过添加CBAM(Convolutional Block Attention Module)[15]、动态卷积以及空间金字塔池化模块以增强目标特征信息的权重,进一步提高手术器械检测的准确度并降低漏检率。最后,在模型的Neck部分添加基于特征金字塔网络(FPN)的语义分割分支,同时实现手术器械的检测和语义分割功能,辅助外科医师提高手术效率,减小手术难度。","result":"介绍了基于视觉的内窥镜手术在深度学习时代受到的关注,以及手术器械检测与分割在评估外科医师手术技能中的重要性。文中回顾了国内外在手术器械检测与分割方面的研究进展,包括Faster-RCNN、DSRD-Net、Anchor-free卷积神经网络等方法,并指出现有算法在参数量、运算量、检测速度、功能性等方面的不足。针对内窥镜手术中反光、遮挡等问题,本文提出了一种改进的YOLOv5s方法,通过Gamma校正、CBAM、动态卷积等技术优化图像处理和特征提取,提高检测准确度和降低漏检率,并在模型中加入FPN实现语义分割功能,以辅助外科医师提高手术效率。","language":"zh"},{"title":"基于改进YOLOv5s的手术器械检测与分割方法","chapter":"2 方法","content":"本文基于YOLOv5s算法框架,针对手术器械的检测与分割问题进行优化,以实现内窥镜图像中手术器械的检测与分割[16],本文算法的整体网络结构如图1所示。在内窥镜图像进行训练之前,需要对图像进行图像增强、图像填充和锚框计算等预处理。在Backbone部分,以YOLOv5s为基础,添加5个Conv模块和C3模块,每一个Conv模块都包含一个1×1的卷积核。对输入的特征图像进行卷积操作,同时通过BatchNorm正则化函数和SiLU激活函数[17]进行处理。C3模块中包含3个标准的Conv卷积层,对残差特征进行学习。特征信息进入C3模块后分为两个分支:一个分支使用多个Bottleneck和3个标准卷积层;另一个分支经过一个卷积模块。然后将两个分支通过Concat进行连接。图像输入尺寸为640×640,每次经过一个Conv与C3的组合模块后,特征图会变为原来尺寸的1/2,再经过5次卷积后,输出20×20的特征图。在Neck部分,采用PANet框架,也称为FPN+PAN。FPN特征金字塔是一个自顶向下的过程,如输入FPN的特征图尺寸为20×20,经过2倍上采样后,特征图尺寸变为40×40。Conv模块输出的40×40特征图经过卷积核后,在Concat模块和经过上采样的特征图融合,后续的Conv、C3和Concat模块重复前述步骤。PAN和FPN相反,是一个自底向上的特征金字塔[18]。FPN是自顶向下传递特征内容,而PAN是自底向上传递特征位置,通过组合可以有效融合两者的优点,同时PAN采用80×80的特征图,经过两次Conv与C3的组合模块后,分别输出40×40和20×20的特征图。图1本文算法网络结构图Fig.1Network structure diagram of our algorithm2.1 Gamma校正在基于深度学习的手术器械检测中,图像的亮度会直接影响模型训练的效果。内窥镜视频中出现的手术器械本身多为金属材质,在手术环境下极易出现反光或阴影遮挡等情况,从而影响目标检测的效果。因此,需要在模型训练前对图像进行预处理。本文采用Gamma校正算法,对内窥镜图像进行预处理。Gamma校正算法的公式如式(1)所示: .(1)如图2所示,红色和蓝色曲线分别代表灰度值过高和过低的情况,当r<1或r>1时,Gamma算法会对图像灰度值进行调整。对于图像中灰度值较高的区域,经过校正后灰度值会减小,使r的值接近于1;对于图像中灰度值较低的区域,经过校正后灰度值会增大,使r的值接近于1。图2Gamma校正算法曲线图Fig.2Graph of Gamma correction algorithm2.2 CBAM与动态卷积模块原有算法特征图信息中每个通道的权重相等,这会导致一些无用信息的比重偏大,而关键信息的比重偏小。因此,我们在Backbone底部添加注意力机制模块CBAM,通过学习的方式获取每个通道的比重并生成权重。CBAM可同时应用空间和通道两个不同的注意力维度。在语义分割部分,由于上采样会导致部分语义信息丢失,因此,在语义分割头的C3部分加入CBAM,通过通道注意力模块以减少重要信息的丢失,可防止由于单独添加CBAM模块导致的网络层数过多的问题。图3为CBAM的结构图。图3CBAM结构Fig.3Structure of CBAM另外,将Neck部分的Conv模块更换为动态卷积ODConv模块[19]。注意力机制可赋予权重,通过注意力权重进行学习可以提高CNN网络的准确性并减少计算量。普通的动态卷积仅关注卷积核数量,而其他3个参数(输入通道数、输出通道数、空间大小)容易被忽略。本文使用的ODConv模块可通过对4个维度的并行策略实现对内核空间互补注意力的学习,从而进一步提高模型的准确度。2.3 空间金字塔池化模块优化YOLOv5s使用的空间金字塔池化模块是 SPPF(Spatial Pyramid Pooling Fast),在保持SPP效果的同时提高其速度。本文使用SPPCSPC模块[20](SPP-CSP-Concat),该模块采用CSP结构[21],通过保留SPP不同尺度的最大池化层使模型视野进一步扩大,可解决特征重复提取的问题。同时,可建立一条新的卷积分支,将原图通过卷积核后,与通过最大池化层得到的特征图进行二次合并,可有效减少池化后的特征损失,从而进一步提高检测的准确度。2.4 FPN语义分割头图1中,在FPN和PAN的连接位置增加语义分割头,使80×80的特征图继续按照FPN特征金字塔结构的上采样步骤进行,实现语义分割功能[22]。在生成80×80的特征图后形成两个分支,一个分支进入PAN模块,另外一个分支继续采用自顶向下的上采样结构实现语义分割。因此,本文模型可同时实现目标检测和语义分割。","result":"基于YOLOv5s算法框架,对手术器械的检测与分割问题进行优化。在内窥镜图像训练前,进行图像增强、填充和锚框计算等预处理。Backbone部分添加5个Conv模块和C3模块,通过BatchNorm和SiLU激活函数处理。C3模块包含3个标准Conv层,学习残差特征。特征信息分为两个分支,通过Concat连接。输入尺寸为640×640,经过5次卷积后输出20×20特征图。Neck部分采用PANet框架,结合FPN和PAN的优点,有效融合特征。Gamma校正算法用于预处理,调整图像灰度值。CBAM模块添加到Backbone底部和语义分割头的C3部分,通过学习获取通道权重。动态卷积ODConv模块替换Conv模块,提高CNN网络准确性。空间金字塔池化模块SPPCSPC优化YOLOv5s的SPPF,减少特征损失。在FPN和PAN连接位置增加语义分割头,实现目标检测和语义分割功能。","language":"zh"},{"title":"基于改进YOLOv5s的手术器械检测与分割方法","chapter":"3 实验与结果分析","content":"3.1 数据集本文数据集采用Cholec80,该数据集中包含大量的内窥镜手术视频,我们选取Cholec80中的20个内窥镜手术视频并按照一定的帧频转换成内窥镜图像序列,将其中不存在手术器械或者手术器械较为模糊的图像剔除。数据集包含4 000幅图像,其中3 000幅图像用于训练,1 000幅图像用于测试。本文将数据集中的手术器械分为7类,分别标注为Grasper、 Hook、 Clipper、 Scissors、 SpecimenBag、 Bipolar和Irrigator。由于模型需要同时实现目标检测和语义分割功能,本文分别通过LabelImg和Labelme制作两种不同格式的标签。目标检测标签设定为txt格式,语义分割标签设定为png格式记录掩膜,并对数据集通过Gamma校正算法进行调整优化。通过实验发现,如果数据集中不同类别手术器械的数量相对平均时,Grasper类型的手术器械识别的准确度明显低于其他6类手术器械。因此,我们在数据集中提高了Grasper类型的比例,将Grasper类型的图像数量提高至1 000幅,其余6类手术器械各为500幅图像。图4为数据集样本的部分图像。由图4(a)可以看出,数据集中手术器械受环境的影响较大,导致图像中亮度分布不均,即使是同一幅图像,手术器械的金属部分反光强烈导致亮度过高,而周围环境和手术器械的其余部分相对较暗。因此,通过Gamma校正算法,可使数据集中的图像亮度分布相对均匀,减少外界因素对目标检测的影响,如图4(b)所示。图4(c)为分割掩膜结果。图4数据集样本。 (a) 原图; (b) Gamma校正后结果; (c) 分割掩膜。Fig.4Dataset sample. (a) Original image ;(b) Results after Gamma correction ;(c) Segmentation mask.3.2 训练环境本文的模型训练在Windows 10操作系统上进行,模型由Python编程语言实现,编程软件采用PyCharm。采用CPU进行模型训练相对缓慢,因此,我们通过GPU对网络框架进行模型训练,GPU的硬件配置如表1所示。表1GPU硬件配置Tab.1Hardware configuration of GPU3.3 实验结果分析3.3.1 模型衡量指标本文需要同时衡量目标检测和语义分割的效果。对于目标检测,本文选用mAP@0.5和 损失作为模型的衡量指标;语义分割通过mIoU进行衡量。最后,通过测试集验证实际检测和分割的效果。3.3.2 目标检测效果分析对于目标检测而言,召回率(Recall)和精确度(Precision)是衡量目标检测结果的两个非常重要的指标。AP为通过计算每一个召回率对应精确度的值并进行平均得到的一个衡量标准;mAP是将目标检测中所有种类的AP取平均值的结果。本文将所提方法与其他目标检测算法的AP和mAP进行比较,结果如表2所示。表2不同方法的AP和mAP比较Tab.2Comparison of AP and mAP with different methods由表2可以看出,无论是在不同手术器械的单项AP上还是整体的mAP上,本文方法都要优于其他方法。相较于YOLOv5s,优化后算法在本文手术器械数据集上的mAP@0.5提高了1.8%,达到了98.2%。在单阶段检测方法中,本文算法在mAP@0.5上仍然具有优势,相较于目前流行的SSD和RetinaNet算法,mAP分别高出3.2%和2.8%;相较于经典的双阶段检测方法Faster-RCNN,本文算法的mAP@0.5提高了11.4%,验证了本文方法在AP上的优势。将本文所提方法和YOLOv5s方法的损失曲线进行对比分析,结果分别如图5和图6所示。图5本文所提方法的损失曲线Fig.5Loss curve of the proposed method图6YOLOv5s方法的损失曲线Fig.6Loss curve of the YOLOv5s method从图5和图6可以看出,对于bounding box检测框损失,本文所提方法和YOLOv5s方法都接近0.02。对于obj目标检测损失,最终两者在数值上比较接近。但在验证集val的obj损失曲线上, YOLOv5s在降低到0.012后缓慢回升,并在0.014附近上下波动;而本文所提方法在降低到0.012后,一直较为平稳的维持在0.014以下。从曲线和数据上可以看出,YOLOv5s在测试集val上的损失曲线更加平滑,当epoch为100时,训练集损失曲线也趋于平稳。本文所提方法由于引入语义分割模块,训练集train的obj损失曲线和测试集val的损失曲线几乎趋近于90°,在训练集train最终损失值相差不大的情况下,本文所提方法的损失曲线下降速度最快,在进入平稳期后波动也最小,不会像YOLOv5s一样出现明显的上下波动。在验证集val上,本文所提方法的损失曲线无论是在训练的波动幅度还是最终损失值上都优于YOLOv5s方法,进一步验证了本文方法的有效性和优势。3.3.3 语义分割效果分析mIoU是评价语义分割效果的重要指标[23]。本文通过添加基于FPN网络的语义分割头实现了语义分割功能,目标检测算法的mIoU通过矩形框计算。为更好地比较分析语义分割的效果,本文在相同条件下训练其他语义分割网络并与本文方法进行比较。由于目标检测部分已经实现对于手术器械的分类功能,语义分割只需将手术器械和背景进行区分即可,因此语义分割的类别这里只定义Instruments和Background两类,将所提方法的mIoU值与其他语义分割方法进行比较,结果如表3所示。表3不同方法的mIoU值比较Tab.3Comparison of mIoU with different methods由表3可以看出,本文方法在语义分割方面有着良好的表现,mIoU值达到了94.0%,远高于经典分割网络FCN。相较于Deeplabv3和UNet图像分割网络,本文方法的mIoU分别高出2.2%和1.3%。相较于目前流行的语义分割网络PSPNet,mIoU提高了0.9%,进一步验证了本文方法的有效性和优势。3.3.4 检测与分割结果本文选取数据集中具有代表性的两帧图像进行检测与分割结果分析,结果如图7所示。图7手术器械检测与分割结果Fig.7Detection and segmentation results of surgical instruments由图7(a)可以看出,本文方法能够较好地实现手术器械的检测和语义分割,在多个手术器械同时存在的情况下也能够进行准确识别。但也会存在漏检的情况,如图7(b)所示,相较于被检测出的Scissors类型的手术器械,漏检的手术器械在图像中所占比例相对较小,且受到手术环境的遮挡,导致模型提取的特征信息不足,被检测器误认为是背景信息,因此出现了漏检现象。但是语义分割模块却能够很好地识别该手术器械并进行准确地分割,在一定程度上弥补了目标检测的漏检问题。","result":"实验与结果分析章节首先介绍了Cholec80数据集,该数据集包含4000幅内窥镜手术图像,分为7类手术器械,并对数据集进行了Gamma校正以优化图像亮度分布。训练环境基于Windows 10操作系统,使用Python和PyCharm,并通过GPU加速模型训练。实验结果分析中,本文方法在目标检测的mAP@0.5和损失上优于其他算法,特别是在与YOLOv5s、SSD、RetinaNet和Faster-RCNN的比较中显示出优势。损失曲线分析表明,本文方法在训练和验证集上的损失下降速度最快且波动最小。在语义分割方面,本文方法的mIoU值达到94.0%,高于FCN、Deeplabv3、UNet和PSPNet等网络。最终的检测与分割结果显示,本文方法能准确识别多类手术器械,尽管存在一些漏检情况,但语义分割模块能较好地识别并分割手术器械,弥补了目标检测的不足。","language":"zh"},{"title":"基于改进YOLOv5s的手术器械检测与分割方法","chapter":"4 结论","content":"本文采用改进的YOLOv5s结合FPN的方法实现了手术器械的检测与语义分割功能。通过Gamma校正算法,减轻反光和阴影等因素的影响;通过CBAM、动态卷积模块、空间金字塔池化模块和FPN语义分割模块,提高检测与分割的准确度,并降低漏检率。实验结果表明,手术器械的检测与语义分割效果良好,手术器械检测的mAP@0.5为98.2%,语义分割的mIoU为94.0%。所提方法可辅助外科医师提高手术效率,减小手术难度,实现术中精准导航。","result":"通过改进YOLOv5s和FPN技术,结合Gamma校正、CBAM、动态卷积、空间金字塔池化等模块,有效提升了手术器械的检测与分割精度。实验结果显示,检测mAP@0.5达到98.2%,语义分割mIoU为94.0%,有助于提高手术效率和精准度。","language":"zh"}]
      孟晓亮,赵吉康,王晓雨,张立晔,宋政
      2023, 38(12): 1698-1706. DOI: 10.37188/CJLCD.2023-0025
      摘要:在内窥镜手术过程中,外科医师需实时掌握手术器械的位置信息。现有目标检测算法受反光和阴影等因素影响,其准确度和漏检率仍有优化的空间。本文提出一种基于改进YOLOv5s的手术器械检测与分割方法。首先,通过Gamma校正算法校正图像的亮度和对比度,以解决手术器械的反光和阴影遮挡等问题;其次,设计CBAM和动态卷积模块,增加重要特征信息的权重,以进一步提高目标检测的准确度并减少模型的漏检率;同时,优化空间金字塔池化模块以扩大感受野,从而更好地识别多尺度目标;最后,设计FPN语义分割头,以实现语义分割功能。在内窥镜手术数据集上的实验结果表明,本文目标检测的mAP@0.5为98.2%,语义分割的mIoU为94.0%。所提方法可辅助外科医师快速掌握手术器械的位置和类型,提高手术效率。  
      关键词:手术器械;目标检测;语义分割;注意力机制   
      485
      |
      105
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35329974 false
      发布时间:2024-07-28
    • [{"title":"跨尺度自适应融合的车辆与行人检测算法","chapter":"1 引言","content":"目标检测是计算机视觉领域的核心问题,它的主要任务是对图像中感兴趣的目标进行识别和定位[1],其应用领域十分广泛,如智慧医疗[2-3]、无人驾驶[4]等。车辆和行人检测[5]作为无人自动驾驶技术的重要组成部分,已成为热门研究方向。通用目标检测方法在实际场景下的车辆与行人检测任务中存在不足之处。近些年,已经有较为成熟的增强策略提高多尺度物体的检测性能,包括一些改进融合式特征金字塔结构[6]。白创等人[7]构造多向特征金字塔,充分提取与融合多层语义信息。Wang等人[8]同时利用深层和浅层特征进行双向融合。李经宇等人[9]提出在同一卷积层中收集并拼接不同尺度的局部特征区域,同时缩短高低层特征融合路径,应对复杂场景中车辆行人的检测问题。上述方法虽能优化缓解多尺度目标检测问题,但是没能针对性地联系到当前检测目标的基本特点,具有一定的局限性。此外,关键特征提取不充分也会直接影响模型检测能力[10]。董小伟等人[11]对不同尺度特征层进行针对性加权融合寻找最优融合方式。邹梓吟等人[12]通过融合注意力机制提升模型对遮挡目标的检测能力。尽管上述算法的检测精度有所提升,但对于特定任务下多尺度目标检测结构的设计仍缺乏针对性,还不能高效融合不同语义层次特征,对遮挡性目标的定位仍不准确。而且,相关工作不能平衡准确率与检测速度,还有进一步提升空间。为解决上述问题,本文基于SSD模型展开研究工作,主要内容如下:(1)改进特征提取方式,针对车辆与行人检测任务,提出跳跃式反向特征金字塔结构(Skip Reverse Feature Pyramid Structure,SRFPN)作用于部分检测分支,用以提升对多尺度目标的判别能力。(2)增强关键特征表达能力,提出自适应特征融合模块(Self-Adaptive Feature Fusion Module,SAFM),在通道层面先验计算待融合信息对特征融合过程的贡献度,为特征信息加权。(3)增强模型对目标的定位能力,将十字交叉注意力网络(Criss-Cross Attention Network,CCN)用于模型定位分支前,通过自注意力机制在空间层面获取远距离信息依赖,增强目标定位,优化解决遮挡目标检测问题。","result":"介绍了目标检测在计算机视觉领域的重要性及其在智慧医疗、无人驾驶等领域的应用。车辆和行人检测作为自动驾驶技术的关键部分,现有方法在多尺度目标检测上存在不足。近年来,通过改进特征金字塔结构、融合不同层次特征等策略提升了检测性能,但这些方法仍存在局限性,如关键特征提取不充分、对遮挡目标定位不准确等问题。本文基于SSD模型,提出了跨尺度自适应融合的车辆与行人检测算法,主要包括:1) 改进特征提取方式,提出跳跃式反向特征金字塔结构(SRFPN);2) 增强关键特征表达能力,提出自适应特征融合模块(SAFM);3) 增强模型定位能力,引入十字交叉注意力网络(CCN)。这些改进旨在解决现有算法的不足,提高检测精度和速度。","language":"zh"},{"title":"跨尺度自适应融合的车辆与行人检测算法","chapter":"2 SSD目标检测模型","content":"SSD目标检测模型是一种经典的基于回归思想和Anchor机制的多尺度单阶段目标检测算法,其网络结构如图1所示。图1SSD网络结构Fig.1Network structure of SSDSSD模型通过规范化处理原始输入图像,将其调整至固定大小300×300作为模型的输入。以VGG-16作为基础骨干网络,在不断下采样的过程中逐次通过尺寸大小为38×38、19×19、10×10、5×5、3×3和1×1的6个多尺度特征层,提取输入图像的特征。经过聚合运算,分别通过Loc_ layer和Conf_layer同步计算预测框的位置信息与分类置信度并先验地在预测分支上定义锚框。最后使用非极大值抑制(Non-Maximum Suppression,NMS)的方式保留检测结果最好的预测框并输出检测结果。SSD模型采用多尺度预测方法:使用大尺度特征层预测小目标,使用小尺度特征层预测大目标,以此解决检测过程中存在的目标尺度变化的问题。但其6个检测分支相互独立,经过聚合运算,同步计算预测框的位置信息与分类置信度。此时,底层特征,如Conv4_3,不具备高级语义信息,对目标分类任务不友好;高层特征,如Conv11_2,因卷积运算次数的增加而缺失细节信息,不利于目标定位任务。自浅至深单向传播路径的结构使检测分支的特征信息不充分,模型的检测能力还有很大提升空间。此外,在相同尺度的预测特征层内,各目标之间的尺度大小不一。为识别该层特征层上的所有目标,需要掌握上下文信息,便于目标定位。","result":"SSD模型基于VGG-16网络,通过6个多尺度特征层提取图像特征,使用Anchor机制和规范化输入图像。模型同步计算预测框位置和分类置信度,采用NMS优化检测结果。SSD解决目标尺度变化问题,但存在特征信息不充分和尺度不一的挑战。","language":"zh"},{"title":"跨尺度自适应融合的车辆与行人检测算法","chapter":"3 方法","content":"为解决SSD模型在道路场景中进行车辆与行人检测时,目标多尺度且受复杂环境影响,检测分支携带有效信息变弱、定位能力差,模型准确率低、受遮挡目标漏检率大的问题,本文提出AF-SSD(Attention and Fusion Across Scales-SSD)模型。AF-SSD模型仍采用VGG16作为特征提取主干网络。首先,设计路径由浅至深、由深至浅的跳跃式反向金字塔(SRFPN),即对特征层Conv3_3、Conv4_3、Conv7、Conv8_2、Conv9_2进行跨尺度特征融合,增强部分检测分支Conv4_3、Conv7以及Conv8_2的特征表达;其次,设计自适应特征融合模块(SAFM),替换金字塔结构中对待融合特征直接相加的操作;最后,引入交叉注意力模块(CCN)用于模型定位分支。最终检测分支维度输出依次为512、512、512、256、256、256。AF-SSD模型网络结构如图2所示。图2AF-SSD网络结构Fig.2Network structure of AF-SSD3.1 跳跃式反向特征金字塔结构SSD模型是最早尝试将特征金字塔用于目标检测的模型之一。该模型在利用多尺度特征层的同时,直接引入金字塔结构并不作任何特征融合。其通过特征金字塔结构逐级生成预测特征层,在各预测层上检测图像内对应尺度的目标,解决目标多尺度问题。但是,无融合的分而治之思想也使模型错检、漏检的风险提高。因此为提升SSD算法的检测能力,特征融合必不可少。车辆与行人检测为高差异性的双目标检测任务。高级语义特征融入浅层特征对目标分类有利,此种情况下应重点考虑保留浅层特征内有利于目标定位的信息。FPN[13](Feature Pyramid Network)结构是在自深至浅路径上进行特征融合。PAN[14](Path Aggregation Network)在FPN的基础上增加了自浅至深的特征融合路径,在具备高级语义特征的基础上同时拥有丰富的定位信息。然而,对特征连续上采样会破坏原始特征层中像素连续性[15]。通过插值方式引入的外来信息将继续向前传播,干扰特征的原始分布形成位置偏差。基于双向路径递归融合的金字塔结构引入外来信息的传播路径如图3所示。图3外来信息向前传播路径Fig.3Forward propagation path of foreign information图3中空心箭头表示外来信息向前传播所经路径。由此可见,该结构在车辆与行人检测任务中具有一定的局限性。为解决上述问题,设计了跳跃式反向特征金字塔网络。在自浅至深的路径上,将Conv3_3、Conv4_3、Conv7、Conv8_2层输入SRFPN结构,得到预测特征层P1、P2、P3。SRFPN的主要内容包括调整特征通道数量、特征拼接以及批归一化(Batch Normalization,BN),网络结构如图4所示。图4SRFPN的网络结构Fig.4Network structure of SRFPN需要适当减少特征层中的通道冗余[16-18]。在模型复杂性方面,设置过多的通道数会使部分通道被冗余信息占用,重复参与卷积计算从而降低模型的计算速度;在语义信息方面,CNN架构中通道之间存在特征冗余[19]。因此,在跳跃式反向金字塔结构中将通道数进行调整,不仅能增强关键特征的表达能力,还可以减少冗余的特征,提升模型的检测速度。将特征层在通道层面进行拼接(Concatenate)可以增加描述图像的特征,不改变信息量总和。拼接算子计算过程如式(1)所示: ,(1)其中:Zconcat表示经过拼接算子后的特征,xi、yi分别表示待融合特征,ki表示卷积核大小,*为卷积运算。将BN层置于卷积层与激活函数之间可以加快模型训练时的收敛速度,使模型训练过程更加稳定,避免梯度爆炸或者梯度消失。其核心计算过程如式(2)~(5)所示: ,(2) ,(3) ,(4) ,(5)其中,放缩系数与平移系数为可训练参数,引入二者可使网络的输出尽可能重构原始特征的表达能力。3.2 自适应特征融合模块特征融合的目的是将两个或多个特征层上的信息通过一定的方式进行合并,得到比原特征更具备判断力的特征。在有融合式特征金字塔结构中,经过采样的特征层和本地特征层直接相加会导致特征图映射的上下文不对齐[20]。并且,简单的相加操作仅能为特征层提供固定的线性聚合方式[21]。SKNe[22]和ResNeSt[23]利用对来自同一层的特征进行动态加权平均的方式为特征融合过程提供非线性。但在特征融合时,通常需要将不同分辨率的特征层通过上、下采样的方式调整到同一尺度。如何克服语义不一致、增加非线性并能自适应调整加权因子进行高效融合是增强关键信息表达、提升特征融合能力的核心。由此,本文提出自适应特征融合模块,该模块接收相同尺度大小的特征层,在通道层面经过全局最大池化与全局平均池化获得关键信息对应通道位置,经过运算获得关键特征所在通道的位置,避免复杂运算,其过程如式(6)所示: .(6)为高效捕获通道间的依赖关系,经过一维卷积对相邻通道信息进行交互[24]。将两个待融合特征交互后的结果进行拼接,由模型经过学习得到的超参数自适应地在不同通道层被给予不同权重,再重新分配回特征层聚合。自适应特征融合模块结构如图5所示。图5自适应特征融合模块结构Fig.5Self-adaptive feature fusion module3.3 十字交叉注意力模块为平等对待相同语义特征内不同尺度的目标信息,目标分割领域的Non_Local[25]基于非局部均值滤波思想直接计算两个像素级子特征之间的位置关系,快速捕获长距离位置依赖。十字交叉注意力模块(CCN)[26]以Non_Local为基础,在特征层的横纵方向上聚合像素级子特征信息,其结构如图6所示。图6交叉注意力模块结构Fig.6Criss-cross attention module经过改进得到的交叉注意力模块结构不仅可以减少内存、提升计算效率,还能增加模型对目标的定位能力。本文将CCN用于定位分支部分,分别以各检测分支尺度为范围在和维度上形成远距离特征依赖,精确预测框位置。首先,检测分支,并行经过1×1卷积分别得到尺度大小为的特征图、()以及尺度不变的特征图,同时得到内每个像素特征点对应索引。将向量 与特征图内对应行与列上个特征向量构成集合,通过关联计算,得到与之间的信息关联度,再通过运算得到对应像素级位置的注意力,该过程如式(7)所示: .(7)同样,在特征图中获取对应行列的向量集,经过聚合计算获得对应位置i的非局部上下文信息,该过程如式(8)所示: .(8)对索引进行遍历后,经过以上步骤计算,得到最终的特征图。为避免以十字交叉形式获取远距离特征依赖得到稀疏信息,需连续经过两次该模块。","result":"提出了一种名为AF-SSD(Attention and Fusion Across Scales-SSD)的模型,旨在解决SSD模型在车辆与行人检测中面临的多尺度目标检测、复杂环境影响、低准确率和高漏检率问题。AF-SSD模型基于VGG16网络,通过设计跳跃式反向金字塔(SRFPN)进行跨尺度特征融合,增强检测分支的特征表达能力。同时,引入自适应特征融合模块(SAFM)和十字交叉注意力模块(CCN),以提高模型的定位能力和检测精度。\n\nSRFPN结构通过调整特征通道数量、特征拼接和批归一化(BN)来减少通道冗余,增强关键特征表达,并加快模型训练收敛速度。SAFM模块通过全局池化和一维卷积实现特征的自适应融合,提高特征融合的效率和表达能力。CCN模块基于Non_Local机制,在特征层的横纵方向上聚合像素级子特征信息,增强模型对目标的定位能力。\n\nAF-SSD模型的网络结构设计和关键技术,如SRFPN、SAFM和CCN,共同提升了车辆与行人检测的准确性和鲁棒性,有效解决了SSD模型在复杂道路场景中的检测问题。","language":"zh"},{"title":"跨尺度自适应融合的车辆与行人检测算法","chapter":"4 实验结果与分析","content":"4.1 数据集PASCAL VOC数据集为公开基准数据集,内有20个类别的图像。本文选取包含人类、汽车、公交车、自行车以及摩托车样本的11 178张图片,同时删除其他类别样本的标注信息。其中,选取PASCAL VOC07+12 trainval数据集内8 383张图片进行训练,选取PASCAL VOC2007 test数据集内2 795张图片进行验证。考虑到实际应用情况,自制小型道路交通数据集(Road Traffic Photography,RTP)包含汽车与行人类别。首先,选取KITTI数据集中部分图像并重新划分类别:将Car、Tram、Van、Truck类合并作为Car类,将PersonSitting和Pedestrain合并作为Person类,同时去除其他低相关性类。其次,为增强样本多样性,选用部分网络图像和真实街道拍摄图像作为补充。图像数量对应来源占比约为7∶2∶1,所含对象均涉及不同程度的遮挡。最后,将KITTI数据集转为VOC格式并通过工具软件labelimg对自备图像以VOC格式进行标注。最终得到图像8 100张。随机抽取80%的图片作为训练集(6 500张),将余下20%的图片作为验证集(1 600张)。RTP数据集的数据来源、目标类别以及目标数量分布见表1。表1RTP的数据分布Tab.1Data distribution for RTP4.2 实验设置本文基于Pytorch框架,模型训练采用随机梯度下降算法(Stochastic Gradient Descent, SGD)对网络模型的权重进行更新优化。模型参数设置批次大小为32,使用0.001学习速率进行40k次迭代,然后继续分别以0.000 1和0.000 01的学习率训练10k次。训练均在型号为GTX 1080Ti的显卡上进行,设备显存为12G。4.3 消融实验为验证改进模型AF-SSD各模块的有效性,本文在PASCAL VOC子数据集上设计并实现一系列控制变量实验,消融实验结果见表2。表2消融实验结果Tab.2Results of the ablation experiment在SSD模型上逐步增加反向金字塔结构(SRBPN)、自适应特征融合模块(SAFM)、交叉注意力模块(CCN)操作并记录数值。分析可知:文本模型加入SRBPN,让检测分支之间信息交流、相互补充,但同时参数量也增加,使模型准确度提升1.5%,FPS下降4.4。SAFM模块可以在此基础上使模型精确度提升0.7%,FPS下降1.6,证明该融合模块可以有效保留更多有效信息。交叉注意力模块在损失2 FPS的情况下,精确度继续提升0.6%,证明该模块增强了模型检测能力。4.4 实验结果与分析本文模型在PASCAL VOC子数据集各个类别上的检测结果分别与ION300[27]、Faster-RCNN[28]、YOLO系列算法、无锚点算法FCOS[29]、LNFCOS[30]以及相似输入尺度下SSD改进算法系列(DSSD[31]、EDF-SSD[32]等)进行比较,各类别检测精度详细结果见表3。表3PASCAL VOC子数据的测试集内各类别检测精度对比Tab.3Comparison of detection accuracy of all types in the sub-samples of the PASCAL VOC dataset%表3中已将15种对比算法中最高单一类别数值进行加粗表示,本文模型在5个单一类别中占3项。在Person类别上,本文模型仅次于AFE-SSD模型,同时,在Bus类别上,本文模型与其相差1.6。本文算法在5个类别中的mAP值为87.1,比两阶段算法Faster RCNN高6.9;优于单阶段无锚框FCOS模型及其改进模型LNPCOS,分别高1.4、2;比SSD模型提升3.1;较当前基于SSD模型新提出的代表性改进模型AFP-SSD和RLCADet模型在数值上分别高2、2.1;比YOLOv3和DC-SPP-YOLO模型分别高1、3.3。网络性能评价的指标除准确性之外,还包括网络检测的实时性。为此,将模型分别在Titan X和1080Ti的GPU上进行验证。在Titan X上的验证结果见表4。模型在1080Ti上的验证结果见表5。表4不同算法在Titan X上的验证对比结果Tab.4Comparison of verification results on Titan X for different algorithms表5不同算法在1080Ti上的验证对比结果Tab.5Comparison of verification results on 1080Ti for different algorithms在设备型号为Titan X的情况下,改进模型的检测速度约为Faster R-CNN的6倍、R-FCN的4倍;改进模型的FPS为41.5,比DSSD模型的FPS高36.5、比RSSD高11。在1080Ti的运行环境下,本文改进方法的FPS为77,约为YOLOv3和RLCADet模型的2倍。在两种设备上,本文改进算法的FPS虽没有取得最优值,但仍满足实时性的要求。为了更进一步地验证本文模型在复杂场景道路上对车辆与行人的检测效果,在RTP数据集上进行了验证。在1080Ti上,各模型的检测结果见表6。表6RTP数据集检测结果对比Tab.6Comparison of detection results on RTP由表6可见,改进后的模型在RTP上的精度均值相较原SSD提升3.9。结合表2~表5的结果分析,在精度均值方面,本文模型高于其他模型;在检测速度方面,本文算法满足检测实时性。通过表6数据可知,改进后的算法对道路上的车辆与行人检测效果提升明显,具备更好的鲁棒性。4.5 检测结果与分析为了更直观地评价本文模型与原SSD模型的准确性,图7展示了其在PASCAL VOC的子数据测试集上的可视化效果对比图。图7PASCAL VOC子数据的测试集内SSD算法与本文的检测结果对比Fig.7Detection results comparion of SSD and proposed algorithm in the sub-samples of the PASCAL VOC图7(i)主要展示改进模型针对原模型对目标产生错检、漏检方面的优化情况:SSD模型在复杂背景下将图像中央的垃圾桶误检为行人,只检测出图像右方的1名行人;改进的模型则可以检测到图像内2名行人。图7(ii)、(iii)主要体现模型对遮挡目标的监测情况:改进模型分别以72%和97%的准确率检测出图中原SSD模型未能检测到的被遮挡车辆。改进模型与SSD模型在自制道路目标数据集上的检测结果如图8所示。观察图8(i)可见,改进模型可以将原模型漏检的从左至右第二个车辆目标以88%的准确率检测出来。观察图8(ii)可见,本文模型可以将左后方受遮挡的汽车检测出来,且检测行人的准确率为94%,较原模型高18%。图8道路交通目标数据集上SSD算法与本文算法检测结果对比Fig.8Detection results comparion of SSD and proposed algorithm on RTP target data set","result":"论文的实验结果与分析章节详细描述了跨尺度自适应融合的车辆与行人检测算法的实验设置、消融实验、性能比较和检测效果。使用了PASCAL VOC和自制的RTP数据集进行训练和验证,其中PASCAL VOC数据集包含20个类别的图像,RTP数据集则专注于汽车与行人类别。实验基于Pytorch框架,采用SGD算法进行模型训练,使用不同学习率进行迭代优化。\n\n消融实验验证了AF-SSD模型中反向金字塔结构、自适应特征融合模块和交叉注意力模块的有效性,结果显示这些模块能显著提升模型的检测精度,尽管会略微降低帧率。在PASCAL VOC数据集上,本文模型与其他多种算法进行了比较,包括ION300、Faster-RCNN、YOLO系列等,在多个类别上显示出较高的检测精度,尤其是在Person和Bus类别上表现优异。改进后的模型在mAP值上超越了Faster R-CNN、FCOS、LNPCOS、SSD等算法。\n\n在网络性能评价方面,本文模型在Titan X和1080Ti GPU上的检测速度均满足实时性要求,且在1080Ti上的帧率是YOLOv3和RLCADet模型的2倍。在RTP数据集上的验证进一步证明了模型在复杂场景下对车辆与行人检测的有效性,精度均值较原SSD模型有显著提升。\n\n可视化效果对比图展示了本文模型相较于原SSD模型在目标检测准确性上的优化,尤其是在处理遮挡目标和复杂背景时的表现。在自制道路目标数据集上,本文模型能够检测出原模型漏检的车辆和行人,提高了检测的准确率。","language":"zh"},{"title":"跨尺度自适应融合的车辆与行人检测算法","chapter":"5 结论","content":"针对实际交通场景的车辆与行人检测过程中,目标多尺度及目标间相互遮挡导致模型定位准确率低且漏检率高的问题,本文提出一种注意力和跨尺度融合的改进SSD目标检测模型AF-SSD。该模型的改进部分如下:在SSD的基础上建立跳跃式反双向递归路径;以本文设计的自适应特征融合方式,代替直接相加融合操作;在定位分支部分引入交叉注意力模块,增强模型对遮挡目标的定位能力。改进模型在PASCAL VOC 07+12子数据集、RTP数据集上验证算法在实际应用中的检测能力与鲁棒性。实验结果表明,在保证实时性的情况下,改进方法的精度均值在PASCAL VOC子数据集上提升了2.6%,在自制道路交通数据集上提升了3.9%。本文模型对复杂场景下的多尺度目标和受遮挡的目标具有良好的检测效果。","result":"针对交通场景中车辆与行人检测问题,提出了一种改进的SSD目标检测模型AF-SSD。模型通过建立跳跃式反双向递归路径、自适应特征融合方式和交叉注意力模块,有效提升了对多尺度和遮挡目标的检测能力。实验结果表明,改进方法在PASCAL VOC和自制道路交通数据集上分别提升了2.6%和3.9%的精度,同时保证了实时性,对复杂场景下的检测效果显著。","language":"zh"}]
      李建东,李佳琦,曲海成
      2023, 38(12): 1707-1716. DOI: 10.37188/CJLCD.2023-0037
      摘要:针对道路交通中目标所处环境复杂,存在模型对关键特征提取不充分、目标定位准确率低的问题,选取SSD模型为基本框架展开了特征提取方式、关键信息增强和非局部性特征定位的研究。首先,为针对性地解决道路交通场景下目标多尺度的问题,提出跳跃式反向特征金字塔结构,生成更具判别力的特征;其次,为解决不同语义层次的信息对特征融合过程贡献度不同的问题,设计基于注意力机制的自适应特征融合模块,在通道层面非先验地增强关键特征表达能力;最后,引入十字交叉注意力模块,提升模型对目标的位置敏感度。实验结果表明,与原始SSD模型相比,在保证实时性的情况下,改进方法的精度均值在PASCAL VOC子数据集上提升了2.6%,在自制道路交通数据集上提升了3.9%。综合考量,改进算法可广泛适用于道路车辆与行人检测任务中。  
      关键词:深度学习;车辆与行人检测;特征金字塔;注意力机制;特征融合   
      324
      |
      98
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35642123 false
      发布时间:2024-07-28
    • [{"title":"基于Double-Head的雾天图像目标检测","chapter":"1 引 言","content":"目标检测是计算机视觉中最基本、最重要的任务之一。搭配强大的主干网络,许多基于深度学习的目标检测算法在日常场景中都实现了较高的检测精度,YOLO(You Only Look Once)[1]、SSD(Single Shot Detector)[2]和区域卷积神经网络(Region Convolutional Neural Network, R-CNN)[3-5]均是目标检测的经典算法。为了加强对不同特征尺度的利用,Lin等提出的FPN(Feature Pyramid Network)[6]以及Liu等人提出的PANet[7]均利用特征层的自下而上和自上而下的路径级联对不同特征图提取到的信息进行学习。Libra R-CNN[8]通过对低层次特征和高层次特征的融合增强和正负样本的平衡处理使得网络具有更高的目标检测精度。Li等人[9]通过特征融合以及混合注意对SSD算法进行改进,提升检测精度。然而在真实的雾天场景中,拍摄的图像由于各种因素其图像质量显著下降,模糊、光照不足、物体遮挡会造成图像颜色失真、细节信息缺失等问题。普通的目标检测方法在雾天环境下无法准确定位和识别出目标,其检测性能大幅降低。因此,雾天环境下的目标检测方法研究显得意义重大。Li等人[10]提出了去雾算法AODNet,并将其与检测网络Faster R-CNN结合进行训练,对去雾后的图像进行检测。但是这种图像预处理操作改变了图像的内部结构,且其模型的推理速度和训练速度非常慢,性能也没有得到提高。Wang等提出了FPVDNet[11],在网络中加入雾浓度判别模块和注意力机制。Xie等提出了基于知识引导的方法KODNet[12],通过对数据预处理和目标分布问题分析实现有雾场景下的多目标检测。但是对于雾天图像特征提取过程,上述方法存在语义信息和细节缺失问题,特别是在浓雾图像中,对于一些模糊的目标,在网络中的特征映射关系较弱,深层特征图的目标峰值很低。有关端到端的雾天图像检测算法研究较少。在图像去雾算法暗通道先验法[13]中,作者发现统计的无雾彩色图像的非天空区域里,RGB 3个颜色通道中总有一个通道的像素值很低,趋向于0;而对于有雾图像,其雾景区域的暗通道块的像素值都远大于0,具体的识别方法见第二章理论基础。受此启发,如果能借助雾天图像自身特点,获得更加全面有效的图像信息,提高检测网络对雾区域中目标物体的信息处理能力,则对提升雾天图像检测性能具有重大作用。本文在Double-Head目标检测模型框架的基础上,在特征增强方面,既融合了原始图像经过暗通道先验及处理后得到的先验权重矩阵,又加入了特征图自身的通道自注意力机制以及结合改进的解耦合预测头(Efficient Decoupled Detection Head, EDH),提出了一种新的端到端的目标检测方法来提高雾天场景中的目标检测性能。","result":"介绍了目标检测在计算机视觉中的重要性,并概述了YOLO、SSD、R-CNN等经典算法及其改进。指出了雾天图像质量下降对目标检测性能的影响,以及现有方法在雾天图像特征提取中的不足。提出了基于Double-Head模型框架的新方法,通过融合暗通道先验权重矩阵、通道自注意力机制和改进的解耦合预测头,以提高雾天场景下的目标检测性能。","language":"zh"},{"title":"基于Double-Head的雾天图像目标检测","chapter":"2 理论基础","content":"2.1 Double-Head算法Double-Head算法[14]是由Wu等人提出的新的二阶段检测算法。作者在网络预测头部对全连接头、全卷积头和目标的分类回归任务进行了彻底的分析,发现全连接头比全卷积头具有更高的空间敏感性。全连接头具有更强的区分完整目标和部分目标的能力,但对回归整个目标并不鲁棒。基于此,研究者提出了Double-Head算法,设计了专注于分类的全连接头和目标框回归的全卷积头。在Faster R-CNN中主要采用共享的全连接层进行最后的目标回归和分类,而在Double-Head中采用全连接层进行类别分类,采用全卷积层进行目标的回归。在分类预测任务中,完成分类任务的子模块由2个1 024层的全连接层构成,而回归子模块的全卷积层共包含5个残差卷积块和最后的池化输出1 024维的向量。一个普通的残差卷积块由输入依次经过一个1×1卷积,3×3卷积和1×1卷积后,再加上原始的输入构成,每个残差卷积块最后输出的激活函数为ReLu。Double-Head算法在目标检测任务中具有较高的准确率,因此本文选择其作为基础框架。为了更加有效地利用不同尺度的图像特征,PANet在FPN基础上利用特征层自上而下的信息,再次级联了自下而上的路径,进一步加强了网络对各个尺度的目标的提取能力。Double-Head算法同样借鉴PANet思想,级联不同尺度的特征层。本文通过添加通道和空间双维度的注意力模块对特征提取方面进行改进,并且在预测头部引入可分离卷积,利用设计的卷积模块改进原有解耦合预测头的性能。2.2 暗通道先验法在图像处理领域,有许多研究雾环境的光学模型。其中一个经典模型大气散射模型[15]的方程定义如式(1)所示: ,(1)式中:I(x)是观测图像,与自然雾图像相同;J(x)是场景亮度;t(x)代表介质透射;A代表全球大气光。t(x)定义为: ,(2)式中:β表示大气散射系数,d(x)表示场景深度。He等将暗通道先验与大气散射模型结合提出了暗通道先验去雾算法。作者统计了大量的无雾图像,发现在每一幅图像的非天空区域里,彩色图像RGB通道中至少有一个通道的像素值非常低,几乎趋近于0。暗通道块J的数学表达式如式(3)所示: ,(3)式中:Jc表示彩色图像暗通道块J在像素点x中的一个颜色通道,即RGB通道中的一个;y是以像素点x为中心的矩形区域。根据公式(3)可以得出Jdark=0,即非天空区域的图像块经过暗通道先验后像素值为0,暗通道先验处理后的图像从彩色图像变为灰度图像。雾天图像存在大量雾景区域,雾景区域的RGB 3个通道的像素值都不低,因此其暗通道块远远大于0。基于暗通道先验法处理后的雾天图像可以有效地将雾景区域和前景所分离,给目标检测任务提供了有效的信息。本文通过改进暗通道先验算法提升了检测网络获取雾天图像有效信息的能力。","result":"介绍了基于Double-Head算法的雾天图像目标检测的理论基础。Double-Head算法由Wu等人提出,通过分析网络预测头部,设计了专注于分类的全连接头和目标框回归的全卷积头,提高了目标检测的准确率。此外,章节还讨论了暗通道先验法在图像处理领域的应用,特别是He等人提出的结合大气散射模型的暗通道先验去雾算法,通过统计无雾图像发现RGB通道中至少有一个通道的像素值非常低,利用这一特性可以有效分离雾景区域和前景,为雾天图像目标检测提供有效信息。本文通过改进暗通道先验算法,提升了检测网络获取雾天图像有效信息的能力。","language":"zh"},{"title":"基于Double-Head的雾天图像目标检测","chapter":"3 本文方法","content":"图1是本文所提方法的结构图,基于二阶段方法Double-Head进行改进。在特征增强方面,网络利用原始输入图像经过暗通道先验得到的有效信息和主干网络提取的多尺度深层特征进行有效融合,得到增强的特征图。增强后的特征图经过区域建议网络[3]和ROI池化模块[3]处理后输送至预测头部进行最终的预测。同时,为了使分类和回归都达到更高的精度,使用解耦合检测方法作为预测头部。预测头使用全连接层进行分类,卷积模块进行回归,并在卷积模块中引入了深度可分离卷积,减少了网络模型的参数。图1提出网络的概述图Fig.1Overview of the proposed network3.1 融合暗通道先验权重的特征增强在本文所提方法中,特征增强模块具体结构如图2所示。首先,在主干网络ResNet101[16]和FPN提取到的特征P1~P4的基础上,进一步级联了自下而上的结构,得到特征层N1~N4。其次,为了提高特征层N1~N4每个尺度的特征描述力,在P1、P2、P3的跳跃连接中加入了Enhance模块。Enhance模块主要包含两部分,如图3所示。第一部分为特征自注意力,即在特征层P1~P4输入的基础上,加上了通道池化操作,增加了通道值响应;第二部分为先验权重矩阵的融合,即将原始图像经过暗通道先验法得到的有效信息进一步融合,增强了雾天图像中前景目标和背景的分辨。图2融合特征增强结构示意图Fig.2Structure of the fusion feature enhancement图3Enhance模块的具体结构Fig.3Structure of the Enhance module在图2中的特征图部分,向下箭头是上采样操作,向上箭头是下采样操作,上、下采样操作分别使用双线性插值法和自适应池化法。N1将下采样生成的与N2具备同样尺度的特征和经过Enhance模块增强后的特征图在通道方向拼接起来得到N2,依此类推,获得N3和N4。图3中的通道池化分为最大池化和平均池化,都在输入特征X(256×H×W)的通道维度上进行。最大池化在X的256维的通道上选择最大值作为表征,平均池化则是选取通道上平均为1×H×W的值作为表征。相加后系数经过Sigmoid激活函数与原始输入进行点积运算得到XC。共享的全连接层来计算权重,记为kf,在通道维度上拼接后使用Sigmoid函数来生成通道信息输出矩阵FOC,数学表表达式如式(4)所示: ,(4)其中,表示Sigmoid激活运算。第二部分先验权重的融合如图3中左边分支所示。首先对输入图像进行尺寸缩放得到Y,使其与图3中特征X的输入尺寸一样。然后Y通过暗通道先验法即利用公式(3)运算得到暗通道矩阵I,式(3)中c为Y的R、G、B 3个通道,Ω取5×5大小的区域,即 .(5)接着对暗通道矩阵I中的所有像素值(假设其大小为n(0~255))进行取反操作,变为255-n,使矩阵中天空等背景区域具有较低的矩阵值,目标等前景具备较高的矩阵表征值。此时暗通道矩阵还存在一些冗余表征和背景噪声,需要对其进行滤波操作以增强待检测目标的矩阵响应,同时弱化非目标等背景区域的矩阵响应,即矩阵值的大小。滤波函数采用一阶微分算子sobel算子,能有效降低图像噪声,锐化特征,其公式如式(6)、式(7)所示: ,(6) ,(7)其中:I为暗通道矩阵,为灰度图像;WY为输出的权重矩阵;I和WY大小均为1×H×W。在图3中,WY和XC进行点积运算后,再次和经过1×1卷积后的输入特征X相加,得到最终的输出Z(256×H×W)。雾天图像中的目标对比度更低,纹理特征不清晰,普通的检测算法提取其中目标的能力较低。为了验证本文Enhance模块和所提方法的有效性,如图4所示,将原始的Double-Head方法以及加入Enhance模块后的特征热力图进行了可视化。特征热力图可以直观地展示网络在输入图像上的感受野和特征提取能力。从图4可以看出,右侧图像中汽车和行人位置的热力图颜色更红,具有更大的激活值,而背景的激活值则更小,并且像素点对应目标类别的置信度得分更高,检测结果更加准确。高质量的雾天图像特征图的提取会进一步使预测头最终对目标完成更高质量的分类和回归任务,提升网络的雾天图像目标检测性能。图4热力图对比Fig.4Comparison of feature heat activation map3.2 高效解耦合预测头EDH经过RoIAlign得到的7×7×256大小的特征图最终由解耦合预测头进行分类和回归,具体结构如图5所示。在分类任务分支中,应用两个全连接层进行分类。对于回归任务,全卷积层使用了5个残差模块。第一个残差模块a将输入从256维升至1 024维,具体内部结构对应图6(a),另4个残差模块b如图6(b)所示。图6(b)中5×5表示卷积核大小为5×5的深度可分离卷积块,在减少网络参数量的同时,增加了深层特征的感受野,保证了最终目标框位置回归的精度,其余为普通卷积。深度可分离卷积是轻量化网络Xception[17]的主要结构,主要思想是将标准卷积分解为深度卷积和逐点卷积,即在输入的每个通道独立执行空间卷积,再进行逐点卷积,将深度卷积的通道输出映射到新的通道空间。EDH模块的最终输出是一个k+1维向量用于分类,k×4维的向量用于定位,其中k表示类别个数。图5解耦合预测头结构Fig.5Structure of the decoupled prediction head图6卷积模块结构图Fig.6Structure of the convolution module3.3 损失函数在区域建议网络RPN中,分类任务使用二值交叉熵损失。在预测头EDH中,分类任务使用的是交叉熵损失。对于样本训练过程中的回归任务,均使用Smooth L1损失。Smooth L1损失函数公式如式(8)所示: (8)式中:对于RPN,β设置为1/9;在EDH中,β设置为1。所以 ,(9) .(10)RPN的二值交叉熵损失表示为: .(11)在一个训练批次中,选取部分特征图作为训练样本,其中N是二元分类中的样本数,yi是样本i的标签,正样本为1,负为0,pi是预测样本为正的概率。RPN总损失函数如式(12)所示: .(12)预测头EDH的交叉熵损失如式(13)所示: ,(13)其中:N是多类别样本的数量;k是类别的数量;yic是一个符号函数,如果样本的预测类别是c,则取1,否则取0;Pic是样本i被预测为c类别的概率。整个网络的损失函数L如式(14)所示: ,(14)式中:LRPN是区域建议网络RPN的损失函数;λ1和λ2是预测头中回归损失和分类损失的权重参数,它们平衡了各部分的功能,实现了更好的检测性能。","result":"提出了一种基于改进的Double-Head方法的雾天图像目标检测技术。通过特征增强模块,利用暗通道先验和多尺度特征融合,增强了雾天图像中目标的可检测性。特征增强包括自注意力机制和先验权重矩阵的融合,使用双线性插值法和自适应池化法进行上采样和下采样。解耦合预测头EDH对特征图进行分类和回归,其中分类任务使用全连接层,回归任务使用残差模块和深度可分离卷积。损失函数包括二值交叉熵损失、交叉熵损失和Smooth L1损失,通过权重参数平衡各部分功能,提高检测性能。特征热力图的可视化验证了Enhance模块和所提方法的有效性,展示了网络在输入图像上的感受野和特征提取能力。","language":"zh"},{"title":"基于Double-Head的雾天图像目标检测","chapter":"4 实验结果与分析","content":"4.1 实验细节实验平台硬件为AMD Ryzen Threadripper 1900X 8-Core Processor 3.80 GHz CPU,Nvidia GTX 2080 Ti显卡,64G内存。实验中,网络由随机梯度下降优化器进行训练,动量和权重衰减分别设置为0.9和0.000 1。大多数二阶段检测器,包括本文提出的网络,学习率初始化为0.002 5。式(14)中的λ1和λ2分别设置为2.0和1.5。4.2 数据集和评估指标本节比较了一些现有的主流目标检测方法以验证本文所提出的网络的鲁棒性和高精度。不仅在自然雾天数据集RTTS[18]上进行了评估,还在合成雾天数据集S-KITTI和S-COCOval上进行了评估。S-KITTI和S-COCOval为本文利用大气散射模型分别对KITTI[19]和MS COCO数据集[20]进行雾合成得到的合成数据集。在KITTI和MS COCO的子数据集COCO 2014 val中分别选用7 481和10k余张图像进行雾合成模拟处理,应用大气散射模型和原始清晰图像合成雾天图像,以此得到式(1)中的I(x)。在合成处理中,式(1)和式(2)中的A和β设置为0.6和0.28,以此模拟出逼近真实雾天的图像。RTTS数据集属于自然雾天环境的目标检测数据集,图像主要来源于交通道路等场景。它包含4 322副图像;带有5个类别的标签,即汽车、人、公共汽车、自行车和摩托车,包括大约41 000个目标。对于KITTI数据集,使用其2D数据集进行目标检测任务,包含7 481张图像,包括6个类别:汽车、面包车、行人、有轨电车、卡车和自行车。MS COCO数据集有80个类别,为了使实验检测对象一致,本文在COCO 2014 val中选择了1万张图像,包括摩托车、汽车、公共汽车、火车、自行车和卡车等类别。在RTTS数据集中,采用PASCAL VOC[21]指标平均精度(mean Average Precision, mAP)来评估该方法的检测性能。准确率和召回率的计算公式如式(15)、式(16)所示: ,(15) ,(16)其中:TP表示正样本被识别正确的个数,FP表示负样本被识别为正样本的个数,FN表示正样本被识别为负样本个数。将计算得到的P、R值绘制P-R曲线,计算曲线下的面积,即为AP值,公式如式(17)所示: .(17)对于多个类别N,平均精度mAP公式为: .(18)在S-KITTI数据集和S-COCOval数据集中,使用指标AP、AP75、AP50、APS、APM和APL来评估目标检测的性能。其中AP指标的IoU从0.5依次增加到0.95。AP75和AP50是指其IoU分别设置为0.75和0.5。APS、APM和APL是根据图像中对象的大小设置的AP度量,分别对应图像中相对的小目标、中型目标和大目标。4.3 RTTS实验结果RTTS数据集的标签分布不均,在某些特定角度上的不同类别相似。本文方法在一定程度上克服了这些困难,并取得了较高的性能。如表1所示,每一行记录了不同方法的mAP值和5个类别的AP值,其中指标中IoU的值设定为0.5。表1不同算法在RTTS数据集上的性能对比Tab.1Performance comparison of different algorithms in the RTTS dataset在不增加额外数据的情况下,本文方法实现了最高的mAP值49.37,比FPVDNet高3.97,比KODNet高2.71,比Yolov3[22]高12.98。Double-Head方法在公交车类别中达到了最高的AP值51.53,本文方法在其余类别中达到了最高的性能,汽车类别为66.41 AP值,自行车类别为33.62 AP值,摩托车、行人分别达到了50.12和46.92 AP值。本文方法在通过数据增强操作后,mAP值可以提升至50.33,均高于其他算法。数据增强操作主要包括对训练图像进行翻转、旋转和缩放等。通过数据增强生成的额外图像大约1 000张,这些图像与原始数据一起训练。除摩托车类别外,其他所有类别都处于较高的水平。结果表明,与其他方法相比,本文方法的检测准确率更高,说明本文方法能有效地提取雾天图像中的特征。图7(a)是从RTTS数据集中选择的一幅自然雾天图像,(b)、(c)、(d)是分别使用Double-Head、Cascade R-CNN[25]和本文方法进行检测后的具体结果。在图7(b)中,Double-Head方法错误地将图片右下角的三轮车识别为汽车,并忽略了图片左侧的行人。图7(c)的Cascade R-CNN方法很难检测到汽车,也忽略了左边的行人。图7(d)为本文方法的检测结果,结果表明本文方法可以克服这些问题,生成更准确的检测结果。图7RTTS数据集图像的检测结果示例图Fig.7Examples of RTTS image detection results4.4 S-KITTI和S-COCOval实验结果S-KITTI数据集中出现的小目标物体和遮挡目标较多,使得目标检测任务变得更具挑战性,尤其是在雾天环境中。S-KITTI数据集实验结果如表2所示,除APM指标之外,所提出方法性能均优于其他方法。本文方法的AP、AP75、AP50、APS、APM和APL指标分别为66.7、77.1、90.9、65.6、66.2和71.4,AP75和AP分别比第二高的方法高出1.7和0.8。表2不同算法在S-KITTI数据集上性能对比Tab.2Performance comparison of different algorithms in the S-KITTI dataset如表3所示,当主干网络使用ResNet101时,本文方法的AP、AP75、AP50、APS、APM和APL值分别为57.7、65.1、79.6、41.1、51.1和69.3。AP75、APS和AP分别比第二高的方法高1.5、1.7和0.9,除了AP50之外其余数据均为最高。Double-Head在AP50取得了最大值79.8,仅比本文所提方法高出0.2。结果表明,本文模型在合成雾天数据集S-COCOval上也取得了良好的检测结果,并且应用不同的主干网络仍然具有有效性和鲁棒性。表3不同算法在S-COCOval数据集上性能对比Tab.3Performance comparison of different algorithms in the S-COCOval dataset4.5 消融实验和定量比较表4对预测头的卷积部分进行了实验,通过设定不同数量的卷积块得到不同的AP结果。表4中的模块a和模块b代表图6中的提取模块a和b,模块a主要是将特征图从256维升至1 024维,数量为一个,大小为1.06M;模块b大小为0.81M。考虑到准确率和参数量的平衡,本文的预测头部卷积部分最后选择一个模块a和4个模块b。表4增加不同数量模块b后的参数和AP值比较Tab.4Comparison of the parameters and AP values after adding different number of modules b在RTTS数据集上分别使用不同注意力模块进行实验,结果如表5所示。在不添加注意力模块的情况下,使用Double-Head方法作为基线的mAP值为51.5,分别添加注意力模块SE(Squeeze-and-Excitation)[27]、CA(Coordinate Attention)[28]和CBAM(Convolutional Block Attention module)[29]后,mAP值为51.6、52.2和52.7。使用本文的注意力模块达到了最高的mAP值为53.6,参数量仅增加0.45M。结果表明,与其他注意力模块相比,本文设计的注意力模块具有更高的目标检测性能。表5使用不同注意力模块的实验结果Tab.5Ablation study of proposed component表6展示了提出的特征增强模块和解耦合预测头EDH消融实验的结果。在ResNet50-FPN基线上,对特征图应用本文的注意力模块mAP值提高了0.8,融合改进暗通道先验得到的先验权重mAP值提高了2.4,证明所提出的特征增强模块对检测雾天图像中的目标的有效性。解耦合预测头EDH模块将mAP值从52.9提高到54.3,比ResNet50-FPN基线高出1.4。与基线相比,提出的模块对网络的改进mAP值共提升了3.6。在模型复杂度方面,改进前Double-Head方法模型参数为48.14 MB,推理时间为0.105 s;改进后方法模型参数为52.25 MB,推理时间为0.126 s。表6各个模块的消融实验结果Tab.6Ablation study of proposed component4.6 雾天场景下目标检测结果和分析从数据集中选取了几组代表性的图像分别使用不同的算法进行目标检测结果展示,如图8所示,从上至下依次为原始图像、本文算法、Double-Head算法、Cascade R-CNN算法、FPVDNet和Yolov5算法检测的结果。第一组图像中,除了本文算法外,其余算法都出现了自行车漏检的情况,且行人检测不够准确。在其他组图像中,Double-Head、Cascade R-CNN、FPVDNet和Yolov5均存在对小目标物体漏检的问题,Double-Head算法在第三组图像中更是将卡车错误识别为汽车。本文算法在这些雾天图像中展示出了更精准的检测结果,具有更强的检测性能和鲁棒性。图8不同算法的检测结果Fig.8Detection results of different algorithms in different scenarios本文所提方法在合成数据集不同雾浓度下的检测结果如表7所示。大气散射系数β取不同值分别对应不同程度的雾。在实际雾天场景下,所提方法的目标检测结果如图9所示。场景中的小目标车辆以及遮挡目标仍可以准确检测出来,并进行有效分类,进一步证明本文方法在实际场景中的高目标检测性能。表7所提方法在不同雾天程度下的实验结果Tab.7Experimental results of the proposed method under different foggy conditions图9实际雾天场景检测结果图Fig.9Detection results in the actual foggy scene","result":"实验结果与分析章节详细描述了基于Double-Head的雾天图像目标检测方法的实验设置、数据集、评估指标以及实验结果。实验在AMD Ryzen Threadripper 1900X 8-Core Processor 3.80 GHz CPU和Nvidia GTX 2080 Ti显卡的硬件平台上进行,使用随机梯度下降优化器训练网络。评估了自然雾天数据集RTTS和合成雾天数据集S-KITTI、S-COCOval上的性能,其中S-KITTI和S-COCOval是通过大气散射模型合成的雾天图像。评估指标包括mAP、AP、AP75、AP50、APS、APM和APL。\n\n在RTTS数据集上,本文方法在不增加额外数据的情况下实现了最高的mAP值49.37,通过数据增强操作后,mAP值提升至50.33。在S-KITTI数据集上,本文方法在除APM指标外的其他指标上均优于其他方法。在S-COCOval数据集上,本文方法使用ResNet101作为主干网络时,大部分指标优于其他方法。\n\n消融实验部分,通过调整预测头的卷积部分和注意力模块,验证了所提方法的有效性。实验结果表明,增加注意力模块可以提高mAP值,本文设计的注意力模块在参数量增加较少的情况下取得了最高的mAP值。特征增强模块和解耦合预测头EDH模块的消融实验也证明了这些模块对提高检测性能的有效性。\n\n在雾天场景下的目标检测结果和分析部分,展示了不同算法在代表性图像上的检测结果。本文算法在雾天图像中展示了更精准的检测结果,具有更强的检测性能和鲁棒性。此外,本文方法在不同雾浓度下的检测结果表明,即使在高雾浓度条件下,也能保持较高的检测性能。实际雾天场景的检测结果进一步证明了本文方法在实际应用中的有效性。","language":"zh"},{"title":"基于Double-Head的雾天图像目标检测","chapter":"5 结论","content":"本文针对雾天场景下的目标检测任务,提出了一种新的高效且鲁棒的方法。在Double-Head网络上融合了改进暗通道先验法得到的先验权重以及通道和空间双维度的复合注意力,并且改进了预测头部的全卷积层,利用设计的高效解耦合预测头对目标进行最终的分类和回归,提高了在雾天图像上的目标检测精度。本文算法在自然雾天数据集RTTS上取得了49.37%的mAP值,较改进前提升了4.63%。在合成数据集S-KITTI和S-COCOval上AP值分别为66.7%和57.7%。实验结果优于其他主流检测方法,进一步验证了本文算法的适用性和鲁棒性。在未来的工作中,将进一步优化网络,均衡检测精度和速率,使其应用更加灵活。","result":"提出了一种基于Double-Head网络的雾天图像目标检测方法,通过融合改进暗通道先验法得到的先验权重和复合注意力机制,以及改进的全卷积预测头部,有效提高了目标检测精度。在RTTS、S-KITTI和S-COCOval数据集上取得了显著的性能提升,验证了算法的适用性和鲁棒性。未来工作将优化网络结构,平衡检测精度和速率,以实现更灵活的应用。","language":"zh"}]
      李任斯,石蕴玉,刘翔,汤显,赵静文
      2023, 38(12): 1717-1727. DOI: 10.37188/CJLCD.2023-0089
      摘要:雾天环境下的图像对比度低,图像中的目标较为模糊并且其特征提取存在一定难度。现有的目标检测方法对于雾天图像的检测准确率偏低。针对上述问题,本文在Double-Head框架上基于图像的特征提取部分和预测头部进行改进。首先,在提取的深层特征图上添加通道和空间双维度的复合注意力机制,提高网络关注显著目标的能力;其次,将原始图像经过改进的暗通道先验以及处理后得到的先验矩阵和特征图进一步融合,获取更全面的雾天图像特征信息;最后,在预测头部引入可分离卷积,使用解耦合预测头对目标进行最终的分类和回归。该方法在RTTS数据集上的mAP为49.37%,在合成数据集S-KITTI和S-COCOval数据集上的AP值分别为66.7%和57.7%。与其他主流算法相比,本文算法具有更高的目标检测精度。  
      关键词:目标检测;雾天图像;暗通道先验;注意力机制;特征融合   
      95
      |
      70
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 44807456 false
      发布时间:2024-07-28
    • [{"title":"通道型偏振光谱仪望远镜组偏振效应分析与优化","chapter":"1 引言","content":"近年来,由于通道型偏振光谱仪可同时获取目标物体的空间强度、光谱信息和偏振信息,在生命科学[1-2]、大气气溶胶探测[3-5]和目标识别[6-8]等众多领域有重要的应用价值,因此构建具有高精度的通道型偏振光谱仪对大气科学、生物医学等领域的研究具有重要意义。通道型偏振光谱仪由望远镜组、强度调制模块、成像镜组、光谱仪和探测器组成。目标光线在通道型偏振光谱仪的传输过程中,望远镜组和成像镜组均会改变光线的偏振态,导致仪器的偏振探测精度降低。经过分析,发现对入射光线具有准直功能的望远镜组对于仪器偏振探测精度的影响相较于成像镜组更为严重[9]。如果将望远镜组移除使大角度光线直接入射到强度调制模块上,光线会在强度调制模块内发生多次反射,导致光线在强度调制模块内的传输模型复杂化[10-11];而且强度调制模块内元件的尺寸会变得更大,增加系统的加工成本。所以,望远系统对于通道型偏振光谱仪来说是非常重要的。由于望远镜组的加入,一些研究人员对其偏振效应是否影响偏振光谱仪的偏振探测精度进行了分析。杨斌[9]对望远镜组施加不同的偏振效应,观察了复原后的斯托克斯矢量与理论参考值之间的相对误差。邢文赫[12]通过建立偏振辐射传输模型,得到仪器望远镜组的二向衰减与相位延迟对于系统的偏振探测影响较大。虽然上述研究表明望远镜组中的偏振效应会影响仪器的偏振探测精度,但是并未具体分析光波波长、入射角度大小对于望远镜组偏振效应的关系。另外,为保证仪器的光线透过率,望远镜组均会镀有光学薄膜,光学薄膜的偏振特性对于光线波长与入射角度比较敏感[13-14],当仪器工作视场以及波长范围变大时,经过望远模组后光线的偏振特性会发生明显的改变。现在偏振探测仪器有着向更大视场和更宽谱段的设计趋势。因此,研究光线波长与入射角度对望远镜组偏振效应以及对偏振探测精度的影响有着重要的研究意义和应用价值。本文针对偏振仪器大视场、宽谱段的设计趋势,建立了考虑膜系偏振效应的望远镜组穆勒矩阵模型,并设计了低偏振效应薄膜,运用偏振光线追迹的方法仿真出不同膜系的偏振效应与光线波长和入射角度的关系。建立了不同波长和视场下望远镜组偏振效应对偏振测量精度的影响模型,通过傅里叶变换和穆勒矩阵传递法分析望远镜组偏振效应对仪器的偏振探测精度的影响。","result":"介绍了通道型偏振光谱仪在生命科学、大气气溶胶探测和目标识别等领域的应用价值,强调了望远镜组对偏振探测精度的影响。分析了望远镜组偏振效应对仪器性能的影响,指出了现有研究的不足,并提出了研究光线波长与入射角度对望远镜组偏振效应及其对偏振测量精度影响的重要性。本文建立了考虑膜系偏振效应的望远镜组穆勒矩阵模型,设计了低偏振效应薄膜,并通过仿真分析了不同膜系的偏振效应与光线波长和入射角度的关系,以及望远镜组偏振效应对偏振测量精度的影响。","language":"zh"},{"title":"通道型偏振光谱仪望远镜组偏振效应分析与优化","chapter":"2 基本原理","content":"2.1 通道型偏振光谱仪的工作原理通道型偏振光谱仪运用的是偏振光谱强度调制技术(Polarimetric Spectral Intensity Modulation,PSIM),其最早由日本学者Oka[15]和美国学者Iannarilli[16]等同时提出,工作原理如图1所示。该技术的核心器件由两个多级相位延迟器和一个偏振分析器组成,该模块将入射光线的斯托克斯参量分别调制到不同频率上,用光谱仪接收并进行傅里叶逆变换后,各斯托克斯光谱分量在光程差域上彼此分开,然后采用带通滤波实现频域截取并通过傅里叶变换获取以下3项参数: ,(1) ,(2) .(3)图1PSIM的工作原理示意图Fig.1Schematic diagram of the working principle of PSIM2.2 望远镜组偏振效应影响因素由于光学透镜属于非理想偏振元件,偏振效应主要由3部分组成:二向衰减、相位延迟和退偏效应[17]。二向衰减为介质对不同振动方向偏振光的吸收不同,即元件在不同方向上的透过率不同。二向衰减的公式如式(4)所示: ,(4)式中,和分别表示最大透过率和最小透过率。相位延迟是元件在其本征极化(本征态)之间引入的相位差,对于折射率为和以及厚度为的双折射延迟器,在波长下,以弧度表示的延迟如式(5)所示: .(5)退偏效应主要发生在散射过程中,其本质上属于偏振光相干性的减退,通常其在光学系统中的影响非常微弱,可以忽略不计。由上述理论可知,由光学透镜组成的望远镜组中的偏振效应主要来源于二向衰减与相位延迟。在实际工程中,为了满足光学仪器的透过率要求,都会在透镜表面镀上增透膜。但是增透膜不仅可以提高光线的透过率,也是引起光学界面偏振效应产生的主要来源。透射式镜组的偏振效应主要由其透镜表面膜系而引起[18],光学薄膜材料折射率会随波长的变化而变化且光线入射角度的变化会导致光线的偏振分离,引起光线偏振态的变化。在本文中,通道型偏振光谱仪望远镜组的相位延迟主要由于非正入射光线经过光学薄膜所引起,根据矩阵法分析光学薄膜的光学特性即可得到光学薄膜的特征矩阵: ,(6)其中:为第()膜层(以靠近入射介质的膜层为第一层)的有效相位厚度,为第膜层的有效导纳(对S光:,对P光:),为基底材料的折射率,为第膜层的厚度,为光线在第层的传播角度,为基底材料有效导纳(对S光:,对P光:),为光线的入射角,为入射介质材料的折射率,i为虚数单位。正是由于S光和P光导纳的不同,导致相位延迟的产生。","result":"深入分析了通道型偏振光谱仪的工作原理,包括偏振光谱强度调制技术(PSIM)的构成和工作流程,以及如何通过傅里叶逆变换和带通滤波获取关键参数。同时,探讨了望远镜组偏振效应的影响因素,如二向衰减、相位延迟和退偏效应,以及光学透镜和增透膜在偏振效应中的作用。此外,还详细分析了光学薄膜的光学特性,包括有效相位厚度、有效导纳和特征矩阵的计算方法,以及S光和P光导纳差异导致的相位延迟现象。","language":"zh"},{"title":"通道型偏振光谱仪望远镜组偏振效应分析与优化","chapter":"3 望远镜组偏振效应分析与优化","content":"为说明望远镜组偏振效应对通道型偏振光谱仪偏振探测精度的影响,需要建立望远镜组偏振效应对其偏振探测精度的影响模型。本文以一个半视场为23°,工作波段为420~860 nm,光学结构如图2所示的望远镜组为例进行评价分析。图2望远镜组结构Fig.2Telescope group structure该望远镜组由3部分组成,按照光线传播顺序依次为前置望远镜组、强度调制模块和后置望远镜组。杨斌[9]对前置望远镜组和后置望远镜组所引起的偏振效应对于仪器偏振探测精度的影响进行分析,得到前置望远镜组偏振效应严重影响仪器的偏振探测精度的结论。本文针对前置望远镜组展开分析与优化工作。3.1 望远镜组偏振效应对偏振精度的影响模型通道型偏振光谱相机应用场景在自然光下,通常琼斯矩阵只能作用于纯偏振态,例如激光和偏振片出射的光束,不适合表述自然光源出射的部分偏振光和非偏振光。本文通过穆勒矩阵来描述望远镜组光学元件的偏振特性,为此需要了解光学透镜界面的穆勒矩阵表达方法。在均匀和各向同性界面透射玻璃上,有S光和P光本征偏振,并且透射界面极化是二向衰减和相位延迟的组合,特征极化与S和P平面对齐。以S光振动方向为轴,P光的振动方向为轴,为透镜界面引入的S光和P光之间的相位延迟,为S光的透过率,为P光的透过率。光学界面的穆勒矩阵是双衰减器和缓速器穆勒矩阵的乘积,透镜光学界面穆勒矩阵为[19]: ,(7) .(8)对于有光学薄膜的透射界面,根据菲涅尔公式可知,当光线非正入射至光学界面时。根据光学成像原理,同一视场下的平行光线入射会聚焦于探测器的一点。但是由于透镜自身曲率的原因,同一视场角入射下不同光瞳处的光线入射角有差异。为了更精确地描述同一视场角下透镜界面的穆勒矩阵,本文需要将不同光瞳处穆勒矩阵相加并取均值,得到的结果作为该视场下的透镜界面穆勒矩阵。上述透镜界面穆勒矩阵是以平行与垂直于入射面建立的局部坐标系,对于不同光瞳处的穆勒矩阵则需要运用穆勒旋转算符将其转换至同一坐标系下。以平行和垂直于透镜中心光瞳处的S光振动方向为轴和轴,以系统光轴为轴建立坐标系。光线入射面与轴夹角为时,透射穆勒矩阵的旋转算符为,则透射光学界面穆勒矩阵的旋转方程为: .(9)随后构建望远镜组偏振效应对偏振测量精度影响模型,设目标光线的斯托克斯矢量为,光线经过望远镜组和强度调制模块后的斯托克斯矢量为,斯托克斯矢量和穆勒矩阵连乘的顺序与公式(11)穆勒矩阵级联的次序一致,按照光线经过光学元件的先后排序: ,(10)式中:为强度调制模块中偏振片的穆勒矩阵;、为强度调制模块中两个波片的穆勒矩阵;为望远镜组总的穆勒矩阵。随后接收探测器的光强数据并进行傅里叶逆变换。出射光线的斯托克斯矢量会在光程差域上分开,然后采用带通滤波实现频域截取并通过傅里叶变换,得到目标光线的斯托克斯矢量。根据斯托克斯矢量计算得到光线的偏振度(Degree of polarization,DOP)。DOP是国际上常用的用于衡量偏振光学仪器系统偏振测量精度的典型参量,其定义如式(11)所示: .(11)3.2 膜系的偏振效应影响由公式(6)可知,膜系偏振效应会随着光线的入射角度和光线波长的变化而改变。在现阶段通道型偏振光谱仪望远镜组设计中,并没有特别设计低偏振效应膜系,而是使用常用的多层减反射膜。现在光学探测仪器向大视场和宽波段的方向发展,通道型偏振光谱仪对偏振方面有着严格的要求。在保证系统整体透过率的前提下,按照使S光和P光的透过率和相位延迟差值在大角度光线入射的情况下尽可能小的设计要求,进行膜系设计和迭代。考虑膜系偏振效应设计出膜系2,选取常用减反射膜系设计出膜系1。这两种膜系的膜层结构如表1所示。表1不同膜系的膜层结构Tab.1Film structure of different film systems不同膜系的二向衰减值与入射角度的关系如图3所示,以420 nm、580 nm和750 nm波长为例。可以看出,两种膜系的二向衰减值均会随着入射角度的增大而增大,而且光线波长越短,二向衰减值受光线入射角度变化越明显。通过对比可知,420 nm和580 nm波长处的光线以不同角度入射时,膜系2的二向衰减值较膜系1显著降低。例如在420 nm波长处,膜系2的二向衰减值为0.311%,比膜系1处降低了0.286%,但是在750 nm处牺牲了一些二向衰减指标。从图4可以看到,相位延迟值随光线入射角度变化的改变与二向衰减值趋势一致。通过使S光和P光的相位延迟差值最小的设计思路,420 nm和580 nm波长处各个角度光线入射时,膜系2的相位延迟值较膜系1有明显下降。图3不同膜系的二向衰减与入射角度的关系Fig.3Relationship between diattenuation and incident angle of different film systems图4不同膜系的相位延迟与入射角度关系Fig.4Relationship between phase retardation and incident3.3 膜系的偏振效应对仪器偏振探测精度的影响偏振探测精度是衡量通道型偏振光谱仪的关键参数,其精度受其望远镜组偏振效应的影响,通过计算仪器的偏振探测精度可以得到望远镜组不同膜系所产生的偏振效应对于通道型偏振光谱仪偏振探测精度的影响。本文模拟仿真30°线偏振光作为入射至系统的目标光,使用偏振光线追迹法[19-22]计算望远镜头模组在420~860 nm波长和0°~23°视场下各界面的二向衰减和相位延迟值,随后带入望远镜组偏振效应对偏振测量精度的影响模型,通过复原后的斯托克斯矢量计算引入望远镜组偏振效应后的仪器偏振探测精度。仿真时,忽略强度调制模块的方位角安装误差及偏振效应。镀不同膜系望远镜组的偏振探测精度如图5所示。通过图5可以发现,望远镜组在镀不同膜系时,通道型偏振光谱仪的偏振探测精度随波长和视场角变化的趋势基本一致。偏振探测精度与视场角的大小成负相关,与光线的波长成正相关。在420 nm波长和边缘视场下,望远镜组的偏振效应对于仪器偏振探测精度影响最大。随着波长的增大和入射角度的减小,偏振探测精度也逐渐提高。在420~620 nm波长范围下,光线波长与视场角的变化导致望远镜组偏振效应增大,严重影响通道型偏振光谱仪的偏振探测精度。而在620~820 nm波长范围下,偏振探测精度受光线波长与视场角的影响减弱,不同膜系下的仪器偏振探测精度随视场角的增大变化不明显。以750 nm波长数据为例,仪器的偏振探测精度均在99.72%以上。因此,在实际测量过程中,需要重点关注420~620 nm波长范围内,不同视场角下的偏振探测数据。表2为镀有两种膜系的望远镜组在不同波长和视场处的仪器的偏振探测精度。图5镀不同膜系望远镜组的偏振探测精度Fig.5Polarization inversion accuracy of telescope groups coated with different thin films表2不同膜系的偏振探测精度Tab.2Polarization detection accuracy of different films由表2可以得到,在420 nm和580 nm波长下,镀有膜系2的望远镜组仪器的偏振探测精度在中心视场与边缘视场处均高于镀有膜系1的仿真结果,尤其是在420 nm边缘视场下的偏振探测精度提高了3.22%。这是由于在此波长下,膜系2的偏振效应低于膜系1。由以上结果可以得出,低偏振效应膜系可以有效降低望远镜组的偏振效应,提高通道型偏振光谱仪的偏振探测精度。","result":"深入分析了望远镜组偏振效应对通道型偏振光谱仪偏振探测精度的影响,并建立了相应的影响模型。以一个具体的望远镜组为例,该望远镜组由前置望远镜组、强度调制模块和后置望远镜组三部分组成。通过穆勒矩阵描述光学元件的偏振特性,并考虑了不同光瞳处穆勒矩阵的叠加和坐标转换。构建了望远镜组偏振效应对偏振测量精度影响的模型,并通过斯托克斯矢量和穆勒矩阵的连乘来计算偏振度(DOP)。\n\n进一步探讨了膜系偏振效应对仪器偏振探测精度的影响,指出膜系设计需在保证系统整体透过率的同时,使S光和P光的透过率和相位延迟差值尽可能小。通过比较两种不同膜系的二向衰减值和相位延迟值,发现膜系2在420 nm和580 nm波长下具有更低的二向衰减值和相位延迟值,尤其是在420 nm波长处,膜系2的二向衰减值比膜系1降低了0.286%。\n\n最后,通过模拟仿真分析了不同膜系对偏振探测精度的影响。结果表明,偏振探测精度与视场角的大小成负相关,与光线的波长成正相关。在420~620 nm波长范围内,望远镜组偏振效应对仪器偏振探测精度的影响较大,需要特别关注。在750 nm波长下,不同膜系下的仪器偏振探测精度均在99.72%以上。在420 nm和580 nm波长下,镀有膜系2的望远镜组仪器的偏振探测精度高于镀有膜系1的仿真结果,尤其是在420 nm边缘视场下的偏振探测精度提高了3.22%。这表明低偏振效应膜系可以有效降低望远镜组的偏振效应,提高通道型偏振光谱仪的偏振探测精度。","language":"zh"},{"title":"通道型偏振光谱仪望远镜组偏振效应分析与优化","chapter":"4 结论","content":"望远镜组的作用是将入射到强度调制模块的光线准直,是保证通道型偏振光谱仪正常工作不可或缺的一部分。但其在镀膜后所引入的偏振效应会改变入射至强度调制模块光线的偏振态,导致仪器偏振探测精度降低。另外,现在偏振光谱仪器大视场和宽谱段的设计趋势更加增大了对镀膜后望远镜组偏振效应分析的复杂性,所以有必要从视场与波长两个方面分析望远镜组偏振效应对仪器偏振探测精度的影响。本文分析了望远镜组偏振效应的影响因素,建立了镜组偏振效应对偏振测量精度的影响模型。在降低膜系偏振效应的要求下,进行了膜系设计和迭代。运用偏振光线追迹的方法研究了两种膜系在不同波长和视场范围下的偏振效应。最后,带入望远镜组偏振效应对偏振测量精度的影响模型,计算了在不同视场和不同波段下仪器的偏振探测精度。仿真结果表明,420 nm边缘视场下的偏振探测精度提高了3.22%。使用设计的低偏振效应膜系可以降低由望远镜组的偏振效应,有效提高通道型偏振光谱仪的偏振探测精度。","result":"分析了望远镜组偏振效应对通道型偏振光谱仪偏振探测精度的影响,建立了影响模型,进行了膜系设计和迭代,研究了不同波长和视场下的偏振效应,并通过仿真验证了低偏振效应膜系能提高偏振探测精度。","language":"zh"}]
      李作恩,鞠学平,胡春晖,颜昌翔,赵雪梅,杨斌
      2023, 38(12): 1728-1735. DOI: 10.37188/CJLCD.2023-0049
      摘要:为了满足高精度偏振探测要求,通道型偏振光谱仪在设计时需要考虑望远镜组偏振效应的影响,并对其进行相应的分析和优化。首先,分析望远镜组偏振效应的影响因素,采用坐标变换和穆勒矩阵连乘法建立了考虑膜系偏振效应的望远镜组穆勒矩阵模型,并带入通道型偏振光谱仪偏振解调模型。接着,通过同时控制S光和P光的透过率和相位延迟,设计相应的低偏振效应膜系。最后,运用偏振光线追迹的方法对镀有不同膜系的望远镜组进行偏振效应仿真。仿真结果表明,在580 nm和750 nm波长处,低偏振效应膜系与高偏振效应膜系的偏振探测精度变化不明显。而在420 nm波长处,低偏振效应膜系相较于常用膜系的边缘视场偏振探测精度提高了3.22%。低偏振效应膜系可以有效降低通道型偏振光谱仪望远镜组偏振效应,提高仪器的偏振探测精度。  
      关键词:偏振光谱相机;偏振效应;斯托克斯矢量;穆勒矩阵   
      57
      |
      69
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 44807361 false
      发布时间:2024-07-28
    • [{"title":"基于空间雕刻和自注意力机制的卫星姿态估计算法","chapter":"1 引言","content":"随着空间技术的发展,两个航天器之间的空间在轨服务开始受到学术界和工业界的关注[1-3]。在诸如卫星维修、航天器对接、碎片清理等在轨服务中,获取对方航天器相对于己方的姿态是关键的一步。一般而言,空间目标分为合作性和非合作性两类。合作性目标可自主提供自身姿态信息。然而,对于故障卫星和太空碎片等非合作目标而言,其自身无法提供准确的姿态参数,这类目标的姿态只能通过一系列传感器获取。相对于激光雷达的高功耗和立体相机的复杂性,单目相机作为传感器具有轻便、低能耗的特点,非常适用于航天器之间的相对导航场景。因此,如何从单张图像中获取目标的6D(Dimension)姿态是值得深入研究的问题。6D意为6个自由度,包含3个平移自由度和3个旋转自由度。卫星姿态,亦称刚体姿态,是指拍摄图像当前时刻与卫星固连的参考系相对于相机坐标系的旋转和平移。传统的单目姿态算法[4-6]主要依赖从二维图像中手动提取特征,依据特征建立模版匹配,从而估计目标卫星相对于相机所在航天器的姿态。然而,手工提取特征的过程速度慢且鲁棒性差,当图像过曝光或曝光不足时,特征无法被准确提取。目前姿态估计领域的进步主要依赖深度学习算法。这类算法利用神经网络自动提取特征的能力取代传统的图像处理流程。目前,依赖深度神经网络的姿态算法主要分为两类:一阶段算法和二阶段算法。一阶段算法尝试直接从二维图像空间映射到六维姿态空间,属于端到端范式,依靠神经网络的拟合能力完成上述映射的搜索[7-9]。该端到端范式一般有两种形式:分类形式和拟合形式。分类形式将姿态空间离散成一个个小的区间,每个区间用一个类别表示,然后用神经网络预测图中航天器的类别[10-11]。拟合形式则不依赖离散化,而是直接根据输入图像预测一个六维姿态向量[12-13]。一阶段算法虽然流程简单,但普遍精度不高、泛化能力不好,神经网络的优化难度大,网络难以学到有效的特征以表征目标姿态。基于神经网络的两阶段算法首先在图像上定位若干二维关键点,然后利用2D-3D匹配技术寻找目标图像与三维模型的关系,从而计算目标姿态[14-17]。在此类方法中,图像中的关键点充当了姿态估计的中间表示,因此关键点的定位越准确,姿态估计越精确。得益于关键点定位技术的鲁棒性,目前二阶段算法在各个姿态估计数据集上都得到了高于一阶段算法的准确度。但卫星上的关键点分布较分散,关键点之间间距较大,卷积神经网络由于感受野受限,存在关键点定位精度不高的问题。且二阶段算法为了训练关键点的定位模型,往往需要人工标注大量图像的掩膜和关键点的位置标签,因此二阶段算法还存在标注成本高的问题。本文针对卷积神经网络的感受野小、全局建模能力差的问题,基于像素投票网络PVNet进行改进,引入了自注意力机制,提高其全局建模能力,提高了关键点定位的准确度。针对二阶段姿态估计算法需要大量人工标注的问题,提出了一种自动获取图像掩膜和关键点标签的流程,具体是通过空间雕刻重构卫星的点云,将点云重投影到像素平面,得到了关键点的像素坐标和粗略的卫星掩膜,再经过形态学闭操作完善掩膜,避免了人工标注这些信息的过程,提高了算法的实用性。实验结果表明,所提方法在省略了大量标注过程的情况下,取得了更高的姿态估计精度。","result":"介绍了空间技术发展背景下,卫星姿态估计在航天器在轨服务中的重要性。讨论了合作性和非合作性空间目标的姿态获取方法,强调了单目相机在相对导航中的应用优势。指出了传统单目姿态算法的局限性,并概述了深度学习算法在姿态估计领域的应用,包括一阶段和二阶段算法的优缺点。针对现有问题,本文提出了基于像素投票网络PVNet改进的自注意力机制,以增强全局建模能力,提高关键点定位精度。同时,提出了一种自动获取图像掩膜和关键点标签的方法,通过空间雕刻技术重构卫星点云并重投影到像素平面,避免了人工标注,提高了算法的实用性和精度。实验结果验证了所提方法的有效性。","language":"zh"},{"title":"基于空间雕刻和自注意力机制的卫星姿态估计算法","chapter":"2 自动获取图像掩膜","content":"2.1 3D点云重构本文构造卫星的点云代表其三维形状,目标点云用表示。为了构造该点云,从数据集中随机选取张参考图像。鉴于姿态估计数据集都提供了每张图像中的卫星姿态标签,这些姿态标签用表示。然后利用多边形标注工具Labelme[18],手动将参考图像中的卫星轮廓标注出来,图1中用表示这些轮廓。图1点云重构过程Fig.1Point cloud reconstruction为了构造卫星的点云,设该卫星的最小外接球面直径为,首先初始化一团以为长宽高的点云立方体,如图1中的立方体所示,其中。对于每个参考索引,根据姿态参数和相机内参,将投影到图像平面,图1中的虚线代表该投影过程,并设得到的投影区域为,根据单目相机的投影原理,可由式(1)表示: .(1)是在图像平面的投影。由于是初始化的点云立方体,必有部分点投影到了目标轮廓区域内以及部分点投影到轮廓区域外,投影到轮廓区域内的点得以保留,其余点切除。由此产生一个三维掩膜,其数学表示如式(2)所示: ,(2)其中:和是的坐标,如此经过N张图像的雕琢,N张三维掩膜的交集,便构成了卫星较为精细的形状。图1展示了点云雕刻过程,雕刻后的点云如图2(a)所示。图2为训练样本自动生成掩膜Fig.2Pipeline of generating mask for training set2.2 基于点云自动获取掩膜标签之所以对目标卫星进行点云重构,一是后面需要进行关键点的2D和3D匹配,有了点云数据,便拥有了关键点的3D坐标;二是在训练关键点定位网络时,需要关键点的位置标签和掩膜标签,有了目标的点云数据后,便可以根据每张图像的姿态标签将点云重投影到像素平面,由此可自动得到训练集每张图像的掩膜标签和关键点标签,从而省略了大量人工标注的过程。图2展示了如何根据卫星的点云得到数据集中每张图像的掩膜。姿态估计数据集提供了每张图像的姿态标签,利用该信息可将卫星点云投影到每张图像上,得到如图2(b)所示的掩膜。但该掩膜存在空洞,原因在于点云数据并不是一种连续数据,于是利用形态学闭操作修补空洞,得到最终的掩膜如图2(c)所示,其对应的原图如图2(d)所示。可见所提方法准确地得到了训练样本的掩膜标签。","result":"介绍了基于空间雕刻和自注意力机制的卫星姿态估计算法中自动获取图像掩膜的过程。首先,通过3D点云重构卫星的三维形状,利用多边形标注工具Labelme手动标注参考图像中的卫星轮廓,然后根据姿态参数和相机内参将点云投影到图像平面,通过保留投影到轮廓区域内的点来生成三维掩膜。接着,基于点云自动获取掩膜标签,利用姿态标签将点云重投影到像素平面,自动得到训练集每张图像的掩膜标签和关键点标签,省略了人工标注过程。最后,通过形态学闭操作修补掩膜中的空洞,得到准确的训练样本掩膜标签。","language":"zh"},{"title":"基于空间雕刻和自注意力机制的卫星姿态估计算法","chapter":"3 姿态估计算法","content":"本文中估计卫星姿态的算法分为两阶段:第一阶段预测向量场,用于定位目标关键点;第二阶段由关键点计算目标姿态。流程简图如图3所示。图3姿态估计算法流程图Fig.3Flowchart of the pose estimation algorithm首先将输入图像裁剪为大小,输入向量场回归网络,再由向量场投票预测关键点位置,最后使用PnP算法计算得到姿态。3.1 基于自注意力的神经网络本文基于PVNet [15]进行改进。针对卫星上的关键点分散、卷积神经网络的感受野受限问题,引入自注意力机制,增强模型的全局建模能力,提高关键点的定位精度。自注意力机制的核心在于:其扫描序列中的每个元素并通过聚合序列中的信息来更新每个元素。自注意力机制的优势在于全局计算和记忆功能,这使得其相比于卷积算子更适合对全局信息进行建模。本文神经网络结构如图4所示。图4神经网络结构Fig.4Structure of neural network图4中,考虑到卷积算子在提取低阶语义以及收敛速度方面的优越性,本文采用卷积层做为backbone,并设backbone输出的特征图为。根据文献[19],自注意力算子处理的是一维度序列,故在进入自注意力模块前,将特征图变形为,其中。然后将特征图分别映射到query、key和value矩阵: (3)其中,为待学习参数。接下来通过矩阵和矩阵计算注意力矩阵 ,(4)其中,为注意力矩阵,代表了特征图中任意两个特征点之间的相关性。矩阵再点乘矩阵,得到新的特征图,即为融合了全局信息的特征图。上述过程即为自注意力算子,在实践中通常采用多头自注意力算子提取更加丰富的特征。3.2 关键点推断机制由于神经网络为每个像素点均预测一个方向向量,理论上方向向量的交点即为关键点的位置,但图像中属于目标体的像素点往往有数万个,这些像素点的方向向量无法严格相交于一点,于是需要投票机制来决定最终关键点的位置[20]。设关键点数量为,对于任意一个关键点,首先随机选取两个像素点,这两个点对应的方向向量的交点记为候选点。该过程重复次,得到的候选点集合记为,代表可能的位置。接下来为每个候选点赋予权重,该权重由所有正样本投票决定(正样本即为属于目标体的像素点): ,(5)其中:表示所有正样本参与投票,表示在向量场中像素点为第个关键点所预测的方向向量。上述关键点的候选位置及其权重代表了关键点在图像空间中的分布概率。该概率的均值代表该关键点的最终定位,而方差则代表该定位的不确定性。于是,经过投票,第个关键点的定位为: .(6)该定位的不确定性为: .(7)3.3 姿态计算前述内容通过点云重构,获悉了关键点的三维坐标;又通过关键点检测技术,获取了关键点在图像中的二维坐标。于是卫星相对于相机参考系的姿态可通过优化如下马氏距离得到: (8)其中:是透视投影函数,由相机内参决定;是第个关键点的三维坐标;为第个关键点的二维坐标;为二维坐标的方差。为待求的姿态参数,其初始值由EPnP[21]算法初始化。为了优化方程(8),本文对比了梯度下降法和LM算法。相比于后者,前者对学习率较敏感,于是选择LM算法进行方程(8)的优化。3.4 关键点的选取关键点的选取需要依目标卫星的形状而定,选取的关键点最好位于卫星的表面,同时,关键点之间的间距应当尽量分散。考虑到Tango卫星的形状近似于长方体与3根天线的组合,于是本文选取了长方体的8个顶点与3根天线的顶点,共个关键点。图5从多个视角展示了11个关键点的分布。图5选取的11个关键点Fig.5Selected 11 landmarks3.5 损失函数神经网络输出两个分支:语义分割分支和向量场分支,两部分的损失函数分别用和表示。对于向量场的监督,本文使用平滑一范数()[22],损失函数如式(9)所示: ,(9)其中:是关键点个数,表示属于目标体的像素点参与计算,为神经网络预测的方向向量,为方向向量的真值,和分别是两个分量。对于语义分割分支的监督,本文使用二值交叉熵损失(Binary cross entropy): ,(10)其中:是神经网络预测的每个像素点属于前景的概率;为真值,意味该像素属于前景而=0说明该像素属于背景。神经网络总的损失函数由以上两部分损失构成: .(11)","result":"论文提出了一种基于空间雕刻和自注意力机制的卫星姿态估计算法。算法分为两阶段:预测向量场定位关键点,计算目标姿态。使用PVNet改进的神经网络,引入自注意力机制增强全局建模能力。自注意力机制通过聚合序列信息更新元素,适合全局信息建模。神经网络结构包括卷积层作为backbone,自注意力模块处理特征图。关键点推断采用投票机制,通过正样本投票确定关键点位置和不确定性。姿态计算通过优化马氏距离,使用LM算法优化。关键点选取考虑卫星形状,选取长方体顶点和天线顶点。损失函数包括向量场的平滑一范数和语义分割的二值交叉熵损失。","language":"zh"},{"title":"基于空间雕刻和自注意力机制的卫星姿态估计算法","chapter":"4 实验与结果","content":"4.1 数据集简介本文在Spacecraft PosE Estimation Dataset[2](SPEED)上进行实验。SPEED由欧洲航天局和斯坦福大学空间交汇实验室在2019年发布,是关于卫星姿态估计的数据集。其包含关于Tango航天器的12 000张合成图像和300张真实图像,用以估计空间物体的距离和方向。每张图像中包含一个Tango航天器,并给出该目标相对于相机的姿态。随后,为了充分模拟空间环境中复杂多变的光照条件,组织者又发布了SPEED+[23],扩充了样本数量,图像中的光照条件更加多变。数据样例可见图5。4.2 评估指标为了全面分析算法的有效性,本文分别对关键点的定位精度和姿态估计精度进行评估,所用的评估指标分别如下。4.2.1 关键点定位的评估指标PCK指标是关键点定位方面常用的精度指标。PCK定义为关键点被正确定位的比例(Percentage of Correct Keypoints),意为模型检测出来的关键点与其真值之间的归一化距离小于阈值的比例。当阈值为0.5时,产生的指标即为PCK@0.5。4.2.2 姿态估计的评估指标根据文献[2],卫星的姿态误差分为两部分:旋转误差和平移误差,图6展示了目标系和相机系之间的相对位姿。平移误差定义为:图6卫星系与相机系的相对变换Fig.6Transformation between satellite body reference and camera reference ,(12)其中:和分别是目标系和相机系的原点,为算法预测的二者之间的位移,则代表其真值。旋转误差则定义为四元数之间的夹角: .(13)4.3 实验参数和配置环境在点云重构过程中,本文从SPEED数据集[2]中随机选取了张参考图像,并手动标注其多边形分割掩膜,然后初始化一个3D立方体,根据70张图像的姿态标签,分别将该立方体投影到图像平面,只有其投影全部落在内的点才得以保留。经过70张图像的雕刻,得到卫星的点云形状如图2(a)所示。在实验数据方面,SPEED提供了12 000张图像及姿态标签,其中10 000张用于神经网络的训练,2 000张用于实验验证。实验的所有代码都采用Python语言基于深度学习框架Pytorch和图像处理工具OpenCV编写,运行环境为Ubuntu 20.04操作系统,并使用Nvidia 2080 GPU加速。4.4 实验结果4.4.1 消融实验为了证明自注意力机制对关键点定位的有效性,本文与原像素投票网络PVNet[15]进行了消融实验,如图7所示。未引入自注意力机制前,原PVNet的定位精度为88.3%;引入一层自注意力层后,定位精度达到了91.5%,即加入了自注意力模块的神经网络取得了更高的关键点定位精度。此外,为了探究自注意力的层数对模型性能的影响,本文逐层增加自注意力层数。随着层数增加至4层,模型的定位能力逐渐提高并趋于稳定。图7关键点定位精度Fig.7Accuracy of landmark localization4.4.2 与其他方案的对比实验作为对比,本文在SPEED数据集上还试验了其他姿态估计领域的经典算法,性能对比如表1所示。由于一阶段算法没有关键点定位过程,故该指标省略。表1不同算法的性能对比Tab.1Performance comparison of different algorithms通过表1可见,一阶段算法的姿态误差要普遍高于二阶段算法。在二阶段算法中,本文方法也取得了更高的关键点定位精度和更低的姿态误差。之所以本文方法取得了更小的姿态误差,原因在于两方面:一是3D点云重构更为精细,二是关键点的定位更加精确。为了直观地说明本文方法的效果,从SPEED测试集中随机抽取了9张图像,图8展示了模型的语义分割效果和关键点定位效果。图8中绿色区域代表模型预测的掩膜,蓝色点代表模型定位出来的关键点。图8显示所提算法精准地在图中识别了卫星区域,这得益于本文自动化地得到了大量掩膜标签,模型得以充分训练;同时模型准确地检测到关键点位置,这得益于自注意机制带来的全局建模能力。图8还显示,所提方法对目标的尺寸具有较好的鲁棒性。通过优化方程(8),图8中的卫星姿态得以解算,并以卫星坐标轴的形式显示在了图9中。图8随机测试的卫星的分割效果和关键点定位效果Fig.8Randomly selected images with the predicted segmentation of the satellite and the landmarks图9估计图8中的卫星姿态,以卫星本体坐标轴显示。Fig.9Same test images in Fig.8 with the predicted poses shown as the satellite coordinates","result":"在Spacecraft PosE Estimation Dataset(SPEED)上进行实验,评估了基于空间雕刻和自注意力机制的卫星姿态估计算法。SPEED数据集包含12,000张合成图像和300张真实图像,用于估计卫星相对于相机的姿态。评估指标包括关键点定位的PCK指标和姿态估计的旋转误差和平移误差。实验中,从SPEED数据集中选取图像进行点云重构,使用10,000张图像训练神经网络,2,000张用于验证。实验代码基于Pytorch和OpenCV,运行在Ubuntu 20.04操作系统上,使用Nvidia 2080 GPU加速。\n\n消融实验表明,引入自注意力机制后,关键点定位精度从88.3%提高到91.5%,且随着自注意力层数的增加,定位能力逐渐提高并趋于稳定。与其他经典算法相比,本文方法在关键点定位精度和姿态误差方面表现更优。原因在于3D点云重构更精细,关键点定位更精确。实验结果通过图8和图9直观展示了模型的语义分割效果、关键点定位效果以及卫星姿态的解算结果,证明了所提算法在目标尺寸鲁棒性和全局建模能力方面的优势。","language":"zh"},{"title":"基于空间雕刻和自注意力机制的卫星姿态估计算法","chapter":"5 结论","content":"本文聚焦于单目视觉卫星姿态估计,着重改善两个问题:一是传统方法需要人工标注关键点位置和图像的掩膜,针对该问题提出了基于空间雕刻的卫星点云重构方式,再将点云投影到像素平面,可自动化生成图像的掩膜和关键点的2D标签,提高了算法实用性;二是卫星上的关键点分布较分散,卷积神经网络由于感受野受限,存在关键点定位精度低的问题,本文在PVNet的基础上,将自注意力机制引入其中,提高了关键点的定位精度,降低了姿态估计误差。在SPEED数据集上的实验结果表明,相比于原PVNet,本文方法的关键点定位精度提升了4.2%,姿态平移误差降低了17.2%,姿态旋转误差降低了20.7%。由于太空中的光照变化大(背光或逆光)、背景变化大(地球为背景或深空为背景)以及目标的尺寸变化大,因此要求姿态估计算法对上述条件具有鲁棒性。考虑到实验数据SPEED充分模拟了上述太空条件,在此条件下本文依然取得了较高的精度,说明本文方法对卫星的6自由度姿态估计具有实用性。","result":"针对单目视觉卫星姿态估计问题,提出了基于空间雕刻的点云重构和自注意力机制的改进方法。通过自动化生成图像掩膜和2D标签,提高了算法的实用性。引入自注意力机制后,关键点定位精度提升4.2%,姿态误差显著降低。在模拟太空条件下的SPEED数据集上,验证了算法的鲁棒性和实用性。","language":"zh"}]
      刘景赫,林宝军
      2023, 38(12): 1736-1744. DOI: 10.37188/CJLCD.2023-0080
      摘要:传统的单目姿态估计算法采用卷积网络在图像中定位若干关键点,再基于2D-3D匹配技术估计目标的姿态,但卫星上的关键点分布较分散,卷积网络由于其受限的感受野导致关键点的定位精度低,影响后续姿态估计的精度。此外传统流程需要人工标注关键点位置和目标的掩膜,标注成本高。为了解决传统方法感受野受限问题,在卷积网络中引入自注意力机制,赋予其全局建模能力,提高了关键点的定位精度。为了改善传统方法需要大量人工标注的问题,通过空间雕刻,重构了目标的点云,再将点云重投影回像素平面,自动化获取所需标签,省略了人工标注过程,提高了算法实用性。实验结果表明:所提算法在SPEED数据集上进行验证,关键点定位精度为92%,姿态平移误差为0.236%,姿态旋转误差为9.86×10-3弧度,在简化算法复杂度的同时提升了精度。可以有效应用于航天器之间的相对姿态估计。  
      关键词:计算机视觉;姿态估计;关键点检测;自注意力;空间雕刻   
      337
      |
      74
      |
      0
      <HTML>
      <网络PDF><WORD><Meta-XML>
      <引用本文> <批量引用> 35642175 false
      发布时间:2024-07-28
    0