In diesem Artikel präsentieren wir einen Ansatz zur Detektion von Wildtieren auf der Grundlage der Extraktion von mehreren Maßstäben umfassenden Kontexten für kleine Stichproben. Zunächst wird die Fähigkeit des Modells, Wildtiere in verschiedenen Maßstäben wahrzunehmen, durch ein Modul zur Extraktion von mehreren Maßstäben Kontext verbessert, was die Detektionsleistung erhöht. Zweitens wird zur Korrektur der Ausgangspunktzahlen des Klassifizierers ein Res2Net-Kalibrierungsnetzwerk eingeführt. Anschließend wird dem RPN ein Mechanismus für den Ersetzungsfokus hinzugefügt, um die Merkmalskarte des Zielbereichs zu verbessern und die Hintergrundinformationen zu schwächen. Schließlich wird ein ausbalancierter L1-Verlust als Positionsverlustfunktion verwendet, um die Ziellokalisierungsleistung zu verbessern. Die Experimente zeigen, dass der Ansatz MS-FSWD die Leistung des neuen AP50-Kurses im Wildtierdatensatz FSWA um 9,9 % und 6,6 % in den 1-shot- und 3-shot-Detektionsaufgaben im Vergleich zum DeFRCN-Ansatz verbessert hat. Auf dem öffentlichen Datensatz PASCAL VOC hat der Ansatz MS-FSWD eine Steigerung von bis zu 12,6 % erreicht. Im Vergleich zum VFA-Ansatz hat der Ansatz MS-FSWD eine Steigerung von 3,3 % in der 10-shot-Aufgabe im Datensatz PASCAL VOC Novel Set 3 erreicht.
关键词
Detektion von kleinen Objekten; Wildtiererkennung; Transferlernen; Extraktion von mehreren Maßstäben Kontext; Fokussierungsmechanismus