Para resolver el problema de la baja precisión en la detección debido a la congestión y ocultamiento mutuo de peatones en escenas naturales complejas, se propuso un algoritmo de detección densa de peatones YOLOv7 basado en la optimización de pesos. En primer lugar, para la extracción de características de peatones ocultos, se utilizó un mecanismo de atención eficiente a múltiples escalas en el espacio (EMA) para redistribuir los pesos de la red principal y aprender la correlación entre diferentes características de canal a través de las dimensiones para potenciar el enfoque del modelo en las áreas visibles de los peatones. En segundo lugar, se diseñó un módulo de conexión ligero y eficiente (ELCM) para mejorar la capacidad de expresión del modelo y acelerar la velocidad de entrenamiento para enfrentar la alta complejidad del modelo de detección. Por último, se construyó una función de pérdida de enfoque del cuadro delimitador Focal-SIoU, que se centra en suprimir muestras de baja calidad y agregar una pérdida angular para mejorar la precisión de detección del modelo. Los resultados de los experimentos mostraron que el algoritmo propuesto alcanzó una precisión promedio en los conjuntos de datos de detección de peatones Wider-Person y Crowd Human del 83,7 % y 82,6 % respectivamente, lo que refleja una ventaja significativa en la detección en multitudes densas en comparación con otros algoritmos avanzados.
关键词
Detección densa de peatones, optimización de pesos, función de pérdida de enfoque del cuadro delimitador, YOLOv7