Fusion d’images infrarouges et visibles basée sur une attention globale à double groupe

ZHAO Yang ,  

YANG Wengui ,  

GAO Cuiyun ,  

摘要

Dans des scénarios complexes, les modèles de fusion ont souvent du mal à extraire pleinement la structure globale à grande échelle des images infrarouges et les caractéristiques locales à petite échelle des images visibles, puis à les fusionner de manière collaborative, ce qui entraîne une qualité de fusion médiocre. Cet article propose un principe de fusion collaborative basé sur une division d’échelle, et conçoit un nouveau modèle de fusion basé sur une structure d’autoencodeur, où l’encodeur et le décodeur utilisent une architecture de réseaux de neurones convolutionnels (CNN). Ce modèle utilise un mécanisme d'attention globale à double groupe, extrait l'information des cartes de caractéristiques regroupées selon la longueur et la largeur, puis pondère les cartes via une carte d'attention croisée à double groupe à travers les canaux, générant une nouvelle carte de caractéristiques contenant plus d'informations globales à grande échelle, réalisant une extraction multi-dimensionnelle des informations d’image ; il utilise un mécanisme de convolution avec pooling atrous multi-échelle, à travers plusieurs tailles de champs réceptifs et des opérations de pooling moyen et médian global pour extraire les caractéristiques locales à petite échelle de l’image ; le décodeur intègre des couches de connexion dense et des connexions sautées pour la structure à grande échelle et les détails à petite échelle, les fusionnant de manière collaborative, et reconstruisant ainsi l’image fusionnée. Les résultats expérimentaux montrent que cette méthode, sur les ensembles de données MSRS et TNO, améliore respectivement l’entropie de l’information, le gradient moyen, l’intensité des bords de 0,95 %, 6,28 %, 6,19 % et 1,75 %, 13,51 %, 11,75 %. La fréquence spatiale a augmenté de 4,61 % sur MSRS, et se place juste après la méthode MDLSR-RFM sur TNO, améliorant efficacement la qualité des images fusionnées dans des scénarios complexes, tout en offrant une bonne stabilité et capacité de généralisation.

关键词

fusion d’images infrarouges et visibles;amélioration d’image;attention globale à double groupe;convolution atrous

阅读全文