Les méthodes actuelles de reconstruction de super-résolution d'images à partir de modèles de diffusion de probabilité sont insuffisantes dans l'extraction d'informations spatiales, ne parviennent pas à exploiter pleinement les informations pertinentes et présentent des phénomènes redondants dans le processus de calcul. Dans cet article, nous concevons une méthode de reconstruction de super-résolution d'images à partir d'un réseau d'attention multidimensionnel. Tout d'abord, sur la base du modèle de diffusion SRDiff, nous proposons une attention multidimensionnelle, combinant l'attention de canal, l'auto-attention et l'attention spatiale, améliorant la capacité du modèle à capturer des caractéristiques à différentes échelles, permettant ainsi de conserver plus de détails et une meilleure cohérence globale lors de la restauration de l'image haute résolution. Ensuite, nous introduisons PConv, une convolution partielle précise pour extraire les caractéristiques spatiales de l'image, améliorant la qualité des résultats de super-résolution et réduisant considérablement la charge de calcul, ce qui améliore l'efficacité du modèle. Sous un facteur d'agrandissement de 4, nous comparons cette méthode avec d'autres méthodes sur 5 ensembles de tests, les résultats montrent que le rapport signal sur bruit de crête de cette méthode est supérieur de 0,762 dB à la moyenne des autres méthodes de comparaison, la similarité structurale est améliorée de 0,082 par rapport à la moyenne des autres méthodes de comparaison. La méthode proposée dans cet article présente subjectivement plus de détails fins et des effets visuels plus impressionnants, et objectivement, une valeur plus élevée de rapport signal sur bruit de crête et de similarité structurale.
关键词
Super-resolution; modèle de diffusion; réseau d'attention multidimensionnel; convolution partielle