Schnelle 3D-Schwachmerkmal-Objekterkennungsmethode mit lokaler Kontextverstärkung

ZHANG Yang ,  

SUN Haijiang ,  

ZHANG Xiaowen ,  

JI Yong ,  

摘要

3D-Objekterkennung wird in Bereichen wie autonomem Fahren und verkörperter Intelligenz häufig eingesetzt, aber sie hat Probleme bei der Unterscheidung und Erkennung schwach ausgeprägter Objekte in der Szene (z. B. entfernte kleine oder verdeckte Objekte). Daher wird in dieser Arbeit eine schnelle Methode zur Erkennung schwach ausgeprägter 3D-Objekte mit lokaler Kontextverstärkung vorgeschlagen. Zunächst wird zur Lösung der Schwierigkeit der spärlichen Merkmalsdarstellung schwach ausgeprägter Objekte ein lokales spärliches Merkmalsverstärkungsmodul (Local Sparse Feature Enhancement Module, LSFE) vorgeschlagen, das die Merkmalsgewichte an lokalen räumlichen Positionen adaptiv anpasst, um die Ausdrucksfähigkeit der spärlichen Merkmale zu verbessern und die Sensitivität des Modells gegenüber diesen Merkmalen zu erhöhen. Zweitens wird für die anfälligen Schwachmerkmale gegenüber Hintergrundstörungen ein Multiskalen-Kontextlernmodul (Multi Scale Context Learning Module, MSCL) vorgeschlagen, das räumliche und kanalbezogene Aufmerksamkeitsmechanismen kombiniert, um multiskalige räumliche Kontextinformationen zu erhalten und Hintergrundstörungen zu unterdrücken. Schließlich wird zur besseren Nutzung oberflächlicher Merkmale der Objekte eine hochauflösende Merkmalschicht in die Netzwerk-Erkennungskopfstruktur integriert, um die Detailwahrnehmung schwach ausgeprägter Objekte zu verbessern. Experimentelle Ergebnisse auf dem KITTI-Datensatz zeigen, dass die vorgeschlagene Methode die Genauigkeit der Erkennung schwach ausgeprägter Objekte im Vergleich zu Basismethoden signifikant verbessert: Die mAP für die Kategorie Fußgänger steigt um 12,78 %, für die Kategorie Radfahrer um 2,69 % und für die Kategorie Auto im Durchschnitt um 6,84 %. Die Methode ermöglicht eine hochpräzise Erkennung bei gleichzeitiger Aufrechterhaltung der Echtzeit-Inferenzgeschwindigkeit und bietet eine effektive Lösung für die 3D-Objekterkennung in komplexen Szenarien.

关键词

autonomes Fahren;Punktwolkendaten;3D-Objekterkennung;Schwachmerkmal-Objekterkennung;lokales Kontextlernen

阅读全文