Die derzeitigen Methoden zur Rekonstruktion der Super-Hochskalierung von Bildern auf der Grundlage von Wahrscheinlichkeitsdiffusionsmodellen weisen Mängel bei der Extraktion räumlicher Informationen auf, nutzen relevante Informationen nicht vollständig aus und weisen redundante Phänomene im Berechnungsprozess auf. In diesem Artikel entwerfen wir eine Methode zur Rekonstruktion der Super-Hochskalierung von Bildern aus einem multidimensionalen Aufmerksamkeitsnetzwerk. Zunächst schlagen wir auf der Grundlage des SRDiff-Diffusionsmodells eine multidimensionale Aufmerksamkeit vor, die Kanalaufmerksamkeit, Auto-Aufmerksamkeit und räumliche Aufmerksamkeit kombiniert und die Fähigkeit des Modells verbessert, Merkmale in verschiedenen Maßstäben zu erfassen, so dass bei der Wiederherstellung des hochauflösenden Bildes mehr Details und eine bessere globale Kohärenz erhalten bleiben. Anschließend führen wir PConv, eine präzise teilweise Convolution, ein, um räumliche Merkmale des Bildes zu extrahieren, die Qualität der Ergebnisse der Super-Hochskalierung zu verbessern und die Berechnungslast wesentlich zu reduzieren, was die Effizienz des Modells verbessert. Bei einem Vergrößerungsfaktor von 4 vergleichen wir diese Methode mit anderen Methoden in 5 Testsets, die Ergebnisse zeigen, dass das Spitzen-Signal-Rausch-Verhältnis dieser Methode um 0,762 dB höher ist als der Durchschnitt der anderen Vergleichsmethoden, die strukturelle Ähnlichkeit im Vergleich zum Durchschnitt der anderen Vergleichsmethoden um 0,082 verbessert wird. Die in diesem Artikel vorgeschlagene Methode weist subjektiv mehr feine Details und beeindruckendere visuelle Effekte auf und subjektiv einen höheren Spitzen-Signal-Rausch-Verhältnis- und strukturelle Ähnlichkeitswerte auf.
关键词
Super-Hochskalierung; Diffusionsmodell; multidimensionales Aufmerksamkeitsnetzwerk; teilweise Convolution