في السيناريوهات المعقدة، غالبًا ما تواجه نماذج الدمج صعوبة في استخراج الهيكل واسع النطاق العالمي لصورة الأشعة تحت الحمراء وميزات التفاصيل الدقيقة المحلية لصورة الضوء المرئي بشكل كامل ودمجهما بشكل تعاوني، مما يؤدي إلى نتائج دمج ضعيفة. يقترح هذا البحث مبدأ الدمج التعاوني القائم على تقسيم الوفاق، وصمم نموذج دمج جديد قائم على هيكلية المشفر التلقائي، حيث يستخدم المشفر وفك الترميز بنية الشبكة العصبية التلافيفية (CNN). يستفيد هذا النموذج من آلية الانتباه المزدوجة العالمية، حيث يتم استخراج المعلومات من خرائط السمات بتقسيمها إلى مجموعتين على طول الاتجاهين الطولي والعرضي، ثم يتم وزن خريطة السمات عبر آلية الانتباه المزدوجة عبر القنوات، مما يولد خريطة سمات جديدة تحتوي على معلومات هيكل واسع النطاق أكثر عالميًا، لتحقيق استخراج معلومات الصور على أبعاد متعددة؛ ويستخدم آلية الالتفاف التجميعي الواسع النطاق المتعددة المقاييس، عبر مجالات استقبال بأحجام مختلفة وتنفيذ عمليات التجميع المتوسط والعيني، لاستخراج ميزات التفاصيل الدقيقة المحلية في الصورة؛ يستخدم فك الترميز دمج الطبقات الكثيفة والاتصالات المتجاوزة للهيكل واسع النطاق وميزات التفاصيل الصغيرة بحيث تندمج بشكل تعاوني، لإعادة بناء الصورة المدمجة. تُظهر نتائج التجارب أن هذه الطريقة على مجموعات بيانات MSRS وTNO تفوقت على الطرق الأخرى بمعدلات زيادة في انتروبي المعلومات، المتوسط التدرجي، وشدة الحواف بمقدار 0.95٪، 6.28٪، 6.19٪ و1.75٪، 13.51٪، 11.75٪ على التوالي. كما ارتفعت الترددات الفضائية بنسبة 4.61٪ على مجموعة بيانات MSRS، وكانت الثانية بعد طريقة MDLSR-RFM على مجموعة TNO، مما يعزز بشكل فعال جودة الصور المدمجة في السيناريوهات المعقدة، مع الحفاظ على استقرار وقدرة تعميم جيدة.
关键词
دمج صور الأشعة تحت الحمراء والضوء المرئي;تعزيز الصور;الانتباه المزدوج العالمي;الالتفاف التجميعي