Les modèles de diffusion traditionnels appliqués à la reconstruction d’images satellitaires en super-résolution présentent des problèmes tels qu’une utilisation insuffisante des conditions a priori, des étapes d’échantillonnage longues, et une récupération médiocre des détails haute fréquence. Cet article propose un réseau de diffusion conditionnelle résiduelle en deux phases (TRCDSR). La première phase utilise un modèle CNN léger pré-entraîné pour générer un résultat super-résolu initial fournissant une condition structurale de haute qualité au modèle de diffusion; la deuxième phase introduit un mécanisme de diffusion conditionnelle résiduelle prenant le signal résiduel en entrée, permettant au réseau de prédiction du bruit de se concentrer sur la reconstruction des détails haute fréquence. En améliorant la formule d’échantillonnage inverse DDIM, le processus de correction des résidus est découplé en une prédiction déterministe et un terme de bruit aléatoire, aboutissant à une reconstruction de haute qualité en 20 à 50 étapes. De plus, un module d’amélioration des conditions a priori multi-échelle (PCEM) et un mécanisme d’attention fusionnant spatial et canal (FAN) sont introduits pour renforcer l’adaptabilité du modèle aux scènes satellitaires complexes. Les expériences sur plusieurs jeux de données de télédétection tels que AID, SECOND et RSSCN démontrent que TRCDSR offre une meilleure qualité de reconstruction, efficacité de calcul et capacité de généralisation comparé aux autres méthodes basées sur la diffusion, GAN et Transformer.
关键词
modèle de diffusion;super-résolution en télédétection;réseau résiduel;renforcement des conditions a priori