La détection d'objets 3D est largement utilisée dans des domaines tels que la conduite autonome et l'intelligence incarnée, mais elle rencontre des difficultés liées à la discrimination et à la détection des objets faibles en caractéristiques dans la scène (comme les objets petits ou occultés à distance). Pour cela, cet article propose une méthode rapide de détection d'objets 3D faibles en caractéristiques avec renforcement du contexte local. Premièrement, pour résoudre la difficulté d'expression des caractéristiques rares des objets faibles, un module d'amélioration des caractéristiques locales rares (Local Sparse Feature Enhancement Module, LSFE) est proposé, qui améliore la capacité d'expression des caractéristiques rares en ajustant de manière adaptative les poids des caractéristiques dans l'espace local, augmentant ainsi la sensibilité du modèle à ces caractéristiques. Deuxièmement, afin de traiter la sensibilité des objets faibles aux interférences du fond, un module d'apprentissage contextuel multi-échelle (Multi Scale Context Learning Module, MSCL) est proposé, combinant des mécanismes d'attention spatiale et canal pour obtenir des informations contextuelles spatiales multi-échelle et supprimer les interférences de fond. Enfin, pour mieux exploiter les caractéristiques superficielles des objets, une couche de caractéristiques haute résolution est ajoutée dans la tête du réseau pour renforcer la perception des détails des objets faibles. Les résultats expérimentaux sur le jeu de données KITTI montrent que la méthode proposée améliore significativement la précision de détection des objets faibles comparée aux méthodes de base, avec une amélioration de 12,78 % mAP pour la catégorie piétons, 2,69 % pour les cyclistes et 6,84 % en moyenne mAP pour les voitures. Cette méthode permet une détection de haute précision tout en maintenant une vitesse d'inférence en temps réel, offrant une solution efficace pour la détection 3D dans des scénarios complexes.
关键词
conduite autonome;données de nuage de points;détection d'objets 3D;détection d'objets faibles en caractéristiques;apprentissage du contexte local