Para resolver los problemas actuales del algoritmo de detección de objetivos para la conducción autónoma, incluida la detección de uno o un pequeño número de objetivos, la detección de múltiples objetivos y las falsas detecciones, en este artículo se presenta un nuevo algoritmo de detección de objetivos para la conducción autónoma basado en una versión mejorada de YOLOv8s.Al reemplazar algunas convoluciones ordinarias en la red principal de YOLOv8s por convoluciones Re-parameterization Conv (RepConv), podemos mejorar la capacidad de percepción de objetivos al tiempo que reducimos la complejidad computacional y el consumo de memoria, mejorando así la eficiencia del modelo.Además, se agregó un mecanismo de atención multi-escala eficiente (EMA) después de la red del cuello C2f, lo que permite mejorar la focalización de las características y la velocidad de convergencia del modelo.Luego, se agregó una cabeza de detección P2 a la red para mejorar la capacidad de detección de objetivos pequeños.Finalmente, se utiliza la función de pérdida Wise-IoU (WIoU), que permite mejorar el rendimiento general del detector a través de un mecanismo de enfoque dinámico no monótono y una estrategia de asignación de ganancias de gradiente.En el conjunto de datos de automóviles anotados manualmente, el modelo mejorado alcanza el 81,2% y el 58,4% para mAP50 y mAP50-95 respectivamente, con un aumento del 1,5% y 1,2% en comparación con el modelo YOLOv8s, con un aumento de precisión y recall del 1,9% y 0,8%, al tiempo que reduce el número de parámetros de 11,14M a 10,87M. El modelo mejorado en comparación con el modelo base aumentó la precisión de la detección al tiempo que redujo el número de parámetros, haciéndolo más adecuado para la tarea de conducción autónoma.
关键词
conducción autónoma; detección de objetivos; YOLOv8s; atención multi-escala eficiente; Wise-IoU