La méthode visuelle traditionnelle Mamba (VIM) aplatit directement les images bidimensionnelles sur un plan unidimensionnel, bien qu'elle puisse obtenir des relations de dépendance à longue distance, mais elle perturbe également la structure spatiale locale des pixels adjacents dans le plan bidimensionnel d'origine, ce qui empêche de capturer les détails locaux. À cet effet, nous introduisons dans cet article un modèle de super-résolution d'images léger dans l'espace d'état complet et proposons un groupe résiduel complet dans l'espace comme bloc principal. Le groupe résiduel complet dans l'espace comprend principalement deux modules innovants, en particulier, nous introduisons d'abord une nouvelle stratégie de balayage en cascade, stimulant l'interaction de l'information locale, inter-échelle et globale, tout en conservant les relations de dépendance globale, permettant ainsi de capturer efficacement l'information locale, ce qui permet d'extraire parfaitement les caractéristiques. Ensuite, nous proposons un bloc d'espace d'état mixte, qui peut interagir simultanément avec l'information des pixels à partir de deux dimensions, limitant l'impact des caractéristiques non pertinentes sur le modèle, pour mettre en évidence la corrélation potentielle entre le canal et l'espace. Par rapport à d'autres méthodes sur les ensembles de données de test standard Set14, Urban100, etc., le PSNR PMambaIR augmente en moyenne de 0,11 dB. L'analyse quantitative et qualitative confirme objectivement que cette méthode présente une valeur PSNR et SSIM plus élevée. L'évaluation visuelle subjective montre des détails plus riches et des effets visuels.
关键词
Super-résolution de l'image; modèle d'espace d'état; modèle léger; stratégie de balayage en cascade