Los métodos actuales de reconstrucción de super resolución de imagen basados en modelos de probabilidad de difusión son insuficientes en la extracción de información espacial, no logran explotar completamente la información relevante y presentan fenómenos redundantes en el proceso de cálculo. En este artículo, diseñamos un método de reconstrucción de super resolución de imagen a partir de una red de atención multidimensional. Primero, sobre la base del modelo de difusión SRDiff, proponemos una atención multidimensional, que combina atención de canal, auto-atención y atención espacial, mejorando la capacidad del modelo para capturar características a diferentes escalas, permitiendo así conservar más detalles y una mejor coherencia global al restaurar la imagen de alta resolución. Luego, introducimos PConv, una convolución parcial precisa para extraer características espaciales de la imagen, mejorando la calidad de los resultados de super resolución y reduciendo considerablemente la carga de cálculo, lo que mejora la eficiencia del modelo. Bajo un factor de aumento de 4, comparamos este método con otros métodos en 5 conjuntos de pruebas, los resultados muestran que la relación señal-ruido de pico de este método es 0,762 dB superior al promedio de otros métodos comparativos, la similitud estructural se mejora en 0,082 en comparación con el promedio de otros métodos comparativos. La método propuesto en este artículo muestra subjetivamente más detalles finos y efectos visuales más impresionantes, y objetivamente, un valor más alto de la relación señal-ruido de pico y de la similitud estructural.
关键词
Super resolución; modelo de difusión; red de atención multidimensional; convolución parcial