Новый метод отслеживания множественных целей пешеходов в сложных транспортных средах

SHENG Wenshun ,  

SHEN Jiahui ,  

CHEN Qi ,  

摘要

Для решения проблем локальных помех в сложной и переменной транспортной среде, таких как преследование пешеходов и частая смена идентификаторов, предлагается метод многократного отслеживания пешеходов, объединяющий YOLOv8 (You Only Look Once-v8) и улучшенную глубокую метрику ассоциаций (Simple Online and Realtime Tracking with a Deep association metric, DeepSORT). Во-первых, для улучшения способности обнаружения информации о пешеходах в плотной транспортной среде в процессе обнаружения был использован алгоритм YOLOv8, обладающий эффективной обработкой небольших масштабовых признаков, обеспечивая точное и быстрое обнаружение. Во-вторых, в ответ на реальную потребность в отслеживании в режиме реального времени, была введена сеть OSNet (Omni-Scale Network) как сеть извлечения признаков на базе DeepSORT. OSNet предоставляет более богатую и точную информацию для последующего отслеживания через многомасштабную динамическую стратегию слияния. В-третьих, для преодоления ограничений традиционного фильтра Калмана при прогнозировании нелинейных движений был разработан инновационный адаптивный алгоритм фильтрации Калмана (Filter Smoothing Kalman Algorithm, FSA), который способен гибко настраивать параметры фильтрации и эффективно справляться с неопределенностью движения пешеходов в сложных транспортных средах, существенно повышая точность прогнозирования. Кроме того, для повышения стабильности и точности сопоставления данных в процессе отслеживания была заменена исходная механизм соотнесения пересечения (IOU) DeepSORT улучшенным алгоритмом полного пересечения (CIOU). CIOU учитывает не только степень перекрытия целей, но также объединяет геометрическую информацию, такую как форма и размер, что эффективно снижает уровень ложных срабатываний и пропусков. Наконец, чтобы снизить воздействие множественных помех на производительность отслеживания, была введена высокоскоростная модель извлечения признаков траектории (GFModel) с сильной обобщающей способностью. Через технику скользящего усреднения эту модель объединяют локальные детали с общим контекстом, обеспечивая точное отслеживание и прогнозирование траектории целевого пешехода. Экспериментальные результаты показывают, что при этот метод достигает точности отслеживания до 77,9%, при этом сохраняя скорость обработки до 55,8 кадров в секунду (Frame Per Second, FPS), полностью удовлетворяя потребности в эффективном и точном отслеживании в сложных транспортных средах.

关键词

Отслеживание пешеходов; YOLOv8; DeepSORT; многократное отслеживание; ассоциативное сопоставление

阅读全文