YOLO-DyMiF: Ein dynamisches multiskaliges Verkehrsschilderkennungsnetz für Plattformen mit geringer Rechenleistung

SONG Shaojian ,  

LI Hao ,  

LI Gang ,  

LI Guojin ,  

摘要

Um das Problem der kleinen Objektgröße von Verkehrsschildern in Szenarien des autonomen Fahrens zu lösen, die leicht durch die Umgebung gestört werden und dadurch eine niedrige Erkennungsgenauigkeit aufweisen, sowie die begrenzte Rechenleistung und den Energieverbrauch von Fahrzeugplattformen, die die Unterstützung komplexer Modelle erschweren, schlägt dieser Artikel einen verbesserten leichtgewichtigen Erkennungsalgorithmus namens YOLO-DyMiF (Dynamischer Mixer und Merkmalsfusion) vor. Dieses Modell basiert auf YOLOv10n und weist zwei Verbesserungen auf: Erstens wurde eine effiziente dynamische Mixer-Struktur (EDMS) auf Basis der adaptiven effizienten Faltung (AEConv) entworfen und in das C3k2-Modul eingebettet, um das C3k2_EDMS-Modul zu bilden, das das C2f-Modul im YOLOv10n-Modell ersetzt und dabei die Merkmalsdarstellungsfähigkeit des Backbone-Netzes beibehält und die Parametermenge effektiv komprimiert; zweitens wurde ein dynamisches Merkmalsfusions-Halsnetz mit dem hierarchischen multiskaligen räumlichen Verstärkungsmodul (HMSE) als Kern entworfen, das durch schichtübergreifende Interaktion und adaptive gewichtete Fusion die mehrskalige Merkmalsdarstellung verbessert und die Erkennungsgenauigkeit kleiner Verkehrszeichen bei gleichzeitigem Erhalt der Leistung bei mittleren und großen Zielen steigert. Die Versuchsergebnisse auf dem TT100K-Datensatz zeigen, dass der YOLO-DyMiF-Algorithmus den mAP50 um 1 % im Vergleich zum derzeit führenden Mamba-YOLOt erhöht, die Modellparameter um 58,3 % reduziert und den Rechenaufwand um 42,3 % senkt. Das vorgeschlagene Modell kann die Rechenkosten erheblich senken und gleichzeitig eine hohe Erkennungsgenauigkeit gewährleisten, wodurch es zuverlässige technische Unterstützung für die Verkehrsschilderkennung in Szenarien des autonomen Fahrens bietet.

关键词

Objekterkennung; Verkehrsschilder; autonomes Fahren; mehrskalige Objekte; Edge Computing

阅读全文