Pour résoudre le problème de la faible précision de la détection due à l'encombrement et à l'occultation mutuelle des piétons dans des scènes naturelles complexes, un algorithme de détection dense des piétons YOLOv7 basé sur l'optimisation des poids a été proposé. Premièrement, pour l'extraction des caractéristiques des piétons occultés, un mécanisme attention multi-échelle efficace dans l'espace (EMA) a été utilisé pour redistribuer les poids du réseau principal et apprendre la corrélation entre différentes caractéristiques de canal à travers les dimensions pour renforcer la focalisation du modèle sur les zones visibles des piétons. Deuxièmement, un module de connexion léger efficace (ELCM) a été conçu pour améliorer la capacité d'expression du modèle et accélérer la vitesse d'entraînement pour faire face à la complexité élevée du modèle de détection. Enfin, une fonction de perte de mise au point de la boîte englobante Focal-SIoU a été construite, qui met l'accent sur la suppression d'échantillons de faible qualité et ajoute une perte d'angle pour améliorer la précision de détection du modèle. Les résultats des expériences ont montré que l'algorithme proposé a atteint une précision moyenne sur les ensembles de données de détection des piétons Wider-Person et Crowd Human à 83,7 % et 82,6 % respectivement, ce qui témoigne d'un avantage de détection significatif dans les foules de personnes denses par rapport à d'autres algorithmes avancés.
关键词
Détection dense des piétons, optimisation des poids, fonction de perte de mise au point de la boîte englobante, YOLOv7