Algorithme de suivi d'objet basé sur Transformer et trajectoire de suivi

WANG Xin ,  

CHEN Zhiwang ,  

WEI Yanqiao ,  

SUN Yixuan ,  

PENG Yong ,  

摘要

Pour résoudre le problème de la dégradation des performances de suivi dans le suivi d'objet unique causée par l'occultation de la cible et l'interférence d'objets similaires, cet article propose un algorithme de suivi d'objet basé sur Transformer et la trajectoire de suivi. L'algorithme utilise Vision Transformer (ViT) comme réseau principal. Pour atténuer la sensibilité du Transformer aux informations de fond lors de l'extraction des caractéristiques, une couche de focalisation est introduite pour ajuster la distribution de l'attention, augmentant le poids de la région cible et supprimant le bruit de fond ; un module d'attention hybride est conçu pour découpler les caractéristiques du modèle et de la zone de recherche : la région du modèle utilise un mécanisme d'auto-attention pour renforcer les caractéristiques de la cible, tandis que la région de recherche fusionne les informations contextuelles globales via une attention croisée. De plus, l'algorithme introduit un post-processeur basé sur la trajectoire de suivi, construisant la séquence des résultats historiques de suivi en trajectoire cible, et utilise le filtre de Kalman pour évaluer la fiabilité des boîtes de délimitation prédites. Si la fiabilité est supérieure au seuil défini, la boîte prédite est directement sortie ; sinon, un suivi inverse est effectué sur la boîte prédite et les boîtes candidates pour générer plusieurs trajectoires et calculer leur correspondance avec la trajectoire cible, sélectionnant la boîte de délimitation optimale pour optimiser le suivi. Lors de la phase d'entraînement, la fonction de perte EIoU est utilisée pour la régression de la boîte, améliorant davantage la précision de localisation. Les résultats expérimentaux montrent que l’algorithme proposé atteint un taux de recouvrement moyen (AO) de 74,6% sur le dataset GOT-10K, une précision (P) de 91,4% sur UAV123, et présente d'excellentes performances sur les datasets LaSOT, TrackingNet et OTB100. Les résultats visuels confirment la stabilité et la précision du suivi de l’algorithme dans des scénarios complexes d'occultation et d'interférences d'objets similaires.

关键词

suivi d'objet; mécanisme d'attention; trajectoire de suivi; occultation de la cible; interférence d'objets similaires

阅读全文