La détection des piétons dans des environnements faiblement éclairés la nuit fait face à des défis tels qu’un taux élevé de fausses détections, des omissions importantes et une précision de reconnaissance insuffisante. À cet égard, cet article propose un algorithme de détection basé sur une version améliorée de RT-DETR, utilisant une conception collaborative multi-modules pour réaliser une détection précise en basse lumière. L’algorithme intègre un module transformateur spatio-temporel (FDT) au sommet de la pyramide des caractéristiques, avec un mécanisme d’attention en deux phases pour renforcer l’extraction de caractéristiques faibles et la modélisation du contexte global ; un module d’échantillonnage dynamique (DySample) est déployé dans le réseau du cou, permettant l’alignement des caractéristiques multi-échelles et l’amélioration de la détection des petits objets via un mécanisme spatial d’échantillonnage réappris dynamiquement ; enfin, le module DRBC3 est utilisé comme noyau d’extraction des caractéristiques, combinant des convolutions multi-taux de dilatation et des techniques de reparamétrisation, construisant un champ réceptif multi-échelle pour améliorer la capture des détails des objets flous et occultés. Les expérimentations sur le dataset LLVIP montrent que cet algorithme diminue le nombre de paramètres tout en augmentant le mAP0.5, la précision (Precision) et le rappel (Recall) respectivement de 1.39%, 2.21% et 3%, avec une amélioration significative de la vitesse d’inférence. Les tests de généralisation sur les datasets NightSurveillance et Nightowls confirment davantage ses performances supérieures. Sous la contrainte du temps réel, l’algorithme améliore efficacement la précision de détection tout en réduisant le taux de fausses omissions, démontrant une bonne robustesse et praticité.
关键词
détection de piétons;RT-DETR;basse lumière;mécanisme d’attention;multi-échelle