Для решения проблемы низкой точности обнаружения малых объектов в аэрофотосъемке из-за значительного изменения масштаба объекта и сложного фона был предложен алгоритм обнаружения на основе совместного восприятия многомасштабного контекста. Во-первых, был разработан модуль улучшения многомасштабности на основе легкой модели (LMEM), интегрирующий механизм внимания для активации локальной выдающейся информации и усиление способности захвата элементов малых объектов. Во-вторых, была разработана модульная архитектура фазовой фиксации многоуровневых признаков на основе контекста (CCFFAM), объединяющая механизм внимания к рецептивному полю и динамическую выборочную технику для достижения подгонки мультиуровневого пространства признаков-каналов с двойным соответствием и адаптивного взвешивания с самосогласованными весами. Наконец, было выполнено перестроение распределения масштаба детекции, и была заменена исходная функция потерь Focaler-CIoU для оптимизации процесса восстановления границ рамки, обеспечивая при этом высокую эффективность обнаружения модели. Эксперименты на наборах данных VisDrone2019 и DOTAv1 показали, что предложенный метод сократил количество параметров модели на 27.9% (2.17M) по сравнению с исходной моделью, а mAP повысились на 5.3% и 1.4% соответственно, что подтверждает хорошую эффективность алгоритма.
关键词
Аэрофотосъемка безpилотником; взаимодействие многомерное; слияние признаков на разных уровнях; легкость