Ante las limitaciones del hardware en escenarios de conducción autónoma y los fenómenos de multiescala y oclusión que afectan el rendimiento de detección, este artículo propone un algoritmo ligero de detección de objetos RT-DETR-light para la tarea de detección de vehículos. En primer lugar, se propone el uso del módulo CG Block para mejorar los módulos convolucionales de la red troncal, y sobre esta base se construye una red ligera de extracción de características CGResNet, logrando un equilibrio entre velocidad de inferencia y precisión de detección. En la etapa de fusión de características, se introduce una red piramidal bidireccional BiFPN, que mejora la precisión mediante la transmisión de información bidireccional. Finalmente, para abordar la insuficiente precisión en la localización de objetivos pequeños y en escenarios con oclusión en la detección de vehículos, se diseña una función de pérdida mejorada EPGIoU, que optimiza la estabilidad del gradiente en escenarios extremos mediante un diseño cooperativo de múltiples restricciones. Los resultados experimentales muestran que el algoritmo alcanza mAP@0.5 y precisión de 75.0% y 74.5% en el conjunto de datos UA-DETRAC, con una reducción de 26.4% y 18.0% en el número de parámetros y el cómputo en comparación con el algoritmo base, y un aumento en la velocidad de detección de 1.4 puntos porcentuales. La evaluación cruzada en el conjunto de datos BDD100K-Sub confirma aún más su capacidad de generalización. El algoritmo propuesto obtiene ventajas significativas en precisión de detección, ligereza y velocidad de inferencia, con una buena capacidad de generalización, proporcionando una mejor solución para la detección en tiempo real de vehículos en escenarios de conducción autónoma y el despliegue en dispositivos edge.
关键词
aprendizaje profundo;algoritmo RT-DETR;ligereza;detección de vehículos