В ответ на аппаратные ограничения в сценариях автономного вождения, а также проблемы с много масштабностью и перекрытиями, ухудшающими производительность детекции, в данной работе предлагается легковесный алгоритм детекции объектов RT-DETR-light для задачи обнаружения транспортных средств. Во-первых, предложено улучшение сверточных модулей основной сети с помощью CG Block, на базе которого построена легковесная сеть извлечения признаков CGResNet, обеспечивающая баланс между скоростью инференса и точностью детекции. На этапе слияния признаков введена двунаправленная сеть пирамиды признаков BiFPN, которая повышает точность за счет двунаправленной передачи информации. Наконец, для решения проблемы недостаточной точности позиционирования мелких объектов и при перекрытиях в задаче обнаружения транспортных средств разработана улучшенная функция потерь EPGIoU, оптимизирующая стабильность градиентов в экстремальных сценариях с помощью многоконтрольного кооперативного дизайна. Экспериментальные результаты показывают, что алгоритм достигает mAP@0.5 и точности 75.0% и 74.5% на датасете UA-DETRAC, при этом количество параметров и вычислений снижено на 26.4% и 18.0% по сравнению с базовой моделью, а скорость детекции увеличена на 1.4 процентных пункта. Кросс-доменные оценки на датасете BDD100K-Sub дополнительно подтверждают его обобщающую способность. Представленный алгоритм демонстрирует значительные преимущества в точности детекции, легковесности и скорости инференса, обладая хорошей способностью к обобщению и предлагая оптимальное решение для реального времени обнаружения транспортных средств и развертывания на периферийных устройствах в сценариях автономного вождения.
关键词
глубокое обучение;алгоритм RT-DETR;легковесный;обнаружение транспортных средств