Para abordar el problema del pequeño tamaño de los objetivos de señales de tráfico en escenarios de conducción autónoma y su facilidad para ser afectados por el entorno, lo que provoca una baja precisión de detección, así como la limitada capacidad computacional y consumo de energía de las plataformas embarcadas que dificultan el soporte de modelos complejos, este artículo propone un algoritmo de detección ligero mejorado llamado YOLO-DyMiF (Mezclador Dinámico y Fusión de Características). Este modelo se basa en YOLOv10n y presenta dos mejoras: primero, el diseño de un mezclador dinámico eficiente basado en convolución adaptativa eficiente (AEConv), llamado Estructura de Mezclador Dinámico Eficiente (EDMS), que se integra en el módulo C3k2 para construir el módulo C3k2_EDMS, reemplazando el módulo C2f en el modelo YOLOv10n, comprimiendo eficazmente la escala de parámetros manteniendo la capacidad de expresión característica de la red troncal; segundo, el diseño de una red de cuello de fusión de características dinámicas centrada en un módulo de mejora espacial jerárquica multiescala (HMSE), que mejora la capacidad de representación de características multiescala mediante interacciones entre capas y fusión adaptativa ponderada, mejorando la precisión en la detección de señales de tráfico pequeñas mientras se mantiene el rendimiento en objetivos medianos y grandes. Los resultados experimentales en el conjunto de datos TT100K muestran que el algoritmo YOLO-DyMiF incrementa el mAP50 en un 1% en comparación con el líder actual Mamba-YOLOt, reduce la cantidad de parámetros del modelo en un 58.3% y disminuye el cálculo en un 42.3%. El modelo propuesto puede reducir significativamente el costo computacional al tiempo que asegura una alta precisión de detección, proporcionando un soporte técnico fiable para la detección de señales de tráfico en escenarios de conducción autónoma.
关键词
Detección de objetivos; señales de tráfico; conducción autónoma; objetivos multiescala; computación en el borde