Algorithme de suivi d'objets basé sur Transformer et trajectoire de suivi

WANG Xin ,  

CHEN Zhiwang ,  

WEI Yanqiao ,  

SUN Yixuan ,  

PENG Yong ,  

摘要

Pour résoudre le problème de la baisse des performances de suivi dans le suivi d'objets uniques causée par l'occlusion de la cible et les interférences d'objets similaires, cet article propose un algorithme de suivi d'objets basé sur Transformer et trajectoire de suivi. Cet algorithme utilise Vision Transformer (ViT) comme réseau principal. Pour atténuer la sensibilité du Transformer aux informations de fond lors de l'extraction des caractéristiques, une couche de focalisation est introduite pour ajuster la distribution de l'attention, renforçant le poids de la région cible et supprimant le bruit de fond ; parallèlement, un module d'attention hybride est conçu pour découpler les caractéristiques du modèle et de la zone de recherche, la zone du modèle utilisant un mécanisme d'attention sur soi pour renforcer les caractéristiques de la cible, tandis que la zone de recherche fusionne les informations contextuelles globales via une attention croisée. De plus, l'algorithme introduit un post-processeur basé sur la trajectoire de suivi qui construit la séquence des résultats historiques de suivi en une trajectoire d'objet et utilise un filtre de Kalman pour évaluer la fiabilité de la boîte englobante prédite. Si la fiabilité dépasse un seuil défini, la boîte prédite est directement sortie ; sinon, un suivi inverse est effectué pour la boîte prédite et les boîtes candidates, générant plusieurs trajectoires et calculant leur correspondance avec la trajectoire cible, la boîte optimale étant sélectionnée pour optimiser les résultats de suivi. La phase d'entraînement utilise la fonction de perte EIoU pour la régression de la boîte englobante afin d'améliorer davantage la précision de localisation. Les résultats expérimentaux montrent que l'algorithme proposé atteint un taux de recouvrement moyen (AO) de 74,6 % sur le dataset GOT-10K, une précision (P) de 91,4 % sur UAV123, et montre également d'excellentes performances de suivi sur les datasets LaSOT, TrackingNet et OTB100. Les résultats de visualisation confirment que cet algorithme maintient un suivi stable et précis même dans des scénarios complexes impliquant occlusions et interférences d'objets similaires.

关键词

suivi d'objets;mécanisme d'attention;trajectoire de suivi;occlusion de cible;interférence d'objets similaires

阅读全文