Dans cet article, nous présentons une méthode de détection des animaux sauvages basée sur l'extraction de contextes multi-échelles pour de petits échantillons. Premièrement, la capacité du modèle à percevoir les animaux sauvages à différentes échelles est améliorée grâce à un module d'extraction de contextes multi-échelles, ce qui améliore la précision de la détection. Deuxièmement, pour corriger les scores de sortie du classifieur, un réseau de calibrage fort appelé Res2Net est introduit. Ensuite, un mécanisme d'attention de remplacement est ajouté dans le RPN pour renforcer la carte des caractéristiques de la région cible et affaiblir les informations de l'arrière-plan. Enfin, une perte L1 équilibrée est utilisée comme fonction de perte de localisation pour améliorer la précision de la localisation des cibles. Les résultats des expériences montrent que la méthode MS-FSWD a amélioré les performances de la nouvelle classe AP50 dans l'ensemble de données d'animaux sauvages FSWA de 9,9% et 6,6% respectivement dans les tâches de détection 1-shot et 3-shot par rapport à la méthode DeFRCN. Sur l'ensemble de données public PASCAL VOC, la méthode MS-FSWD a montré la plus forte amélioration de 12,6%. Comparé à la méthode VFA, la méthode MS-FSWD a montré une amélioration de 3,3% dans la tâche 10-shot sur l'ensemble de données PASCAL VOC Novel Set 3.
关键词
Détection d'objets en petits échantillons; détection d'animaux sauvages; apprentissage par transfert; extraction de contextes multi-échelles; mécanisme d'attention