Zielverfolgungsalgorithmus basierend auf Transformer und Tracking-Trajektorie

WANG Xin ,  

CHEN Zhiwang ,  

WEI Yanqiao ,  

SUN Yixuan ,  

PENG Yong ,  

摘要

Um das Problem der Leistungsminderung beim Einzelziel-Tracking durch Zielverdeckung und Störungen ähnlicher Objekte zu lösen, schlägt dieser Artikel einen auf Transformer und Tracking-Trajektorie basierenden Zielverfolgungsalgorithmus vor. Der Algorithmus verwendet Vision Transformer (ViT) als Backbone-Netzwerk. Um die Empfindlichkeit des Transformers gegenüber Hintergrundinformationen bei der Merkmalextraktion zu verringern, wird eine Fokusschicht eingeführt, die die Aufmerksamkeitsverteilung anpasst, das Gewicht des Zielbereichs verstärkt und Hintergrundrauschen unterdrückt; gleichzeitig wurde ein hybrides Aufmerksamkeitsmodul entworfen, das die Merkmale von Template und Suchbereich entkoppelt, wobei der Template-Bereich eine Selbstaufmerksamkeitsmechanismus verwendet, um Zielmerkmale zu verstärken, und der Suchbereich globale Kontextinformationen durch Kreuzaufmerksamkeit integriert. Darüber hinaus führt der Algorithmus einen auf Tracking-Trajektorie basierenden Nachbearbeiter ein, der die historischen Tracking-Ergebnisse als Zieltrajektorie aufbaut und den Kalman-Filter verwendet, um die Vertrauenswürdigkeit der vorhergesagten Begrenzungsbox zu bewerten. Liegt die Vertrauenswürdigkeit über einem festgelegten Schwellenwert, wird die Vorhersagebox direkt ausgegeben; andernfalls wird für die Vorhersage- und Kandidatenboxen ein Rückwärtstracking durchgeführt, mehrere Trajektorien generiert und deren Übereinstimmung mit der Zieltrajektorie berechnet, wobei die beste Begrenzungsbox zur Optimierung des Tracking-Ergebnisses ausgewählt wird. Während der Trainingsphase wird die Verlustfunktion EIoU für die Begrenzungsboxregression verwendet, um die Positionierungsgenauigkeit weiter zu verbessern. Experimentelle Ergebnisse zeigen, dass der vorgeschlagene Algorithmus eine durchschnittliche Überlappung (AO) von 74,6 % auf dem GOT-10K-Datensatz erreicht, eine Genauigkeit (P) von 91,4 % auf dem UAV123-Datensatz und ebenfalls gute Tracking-Performance auf den Datensätzen LaSOT, TrackingNet und OTB100 zeigt. Die Visualisierungsergebnisse bestätigen, dass der Algorithmus auch in komplexen Szenarien mit Verdeckung und Störung durch ähnliche Objekte ein stabiles und genaues Tracking beibehält.

关键词

Zielverfolgung;Aufmerksamkeitsmechanismus;Tracking-Trajektorie;Zielverdeckung;Störung durch ähnliche Objekte

阅读全文