Die Fußgängererkennung unter schwachem Licht in der Nacht steht vor Herausforderungen wie hoher Falsch-Positiv-Rate, erheblichen Fehlalarmen und unzureichender Erkennungsgenauigkeit. Daher wird in diesem Artikel ein auf dem verbesserten RT-DETR basierender Erkennungsalgorithmus vorgeschlagen, der durch ein kollaboratives Mehrmodul-Design eine präzise Erkennung bei geringem Licht ermöglicht. Der Algorithmus bettet ein räumliches Transformator-Modul (FDT) an der Spitze der Merkmals-Pyramide ein und verwendet einen zweistufigen Aufmerksamkeitsmechanismus zur Verstärkung der Extraktion schwacher Merkmale und zur Modellierung des globalen Kontexts; im Halsnetzwerk wird ein dynamisches Sampling-Modul (DySample) implementiert, das durch einen dynamisch erlernbaren räumlichen Resampling-Mechanismus eine mehrskalige Merkmalsausrichtung und verbesserte Erkennung kleiner Objekte erreicht; als Kern der Merkmalsextraktion dient das DRBC3-Modul, das mehrere Dilationsraten und Reparametrisierungstechniken kombiniert, um mehrskalige rezeptive Felder zu schaffen und die Detailerfassung verschwommener und verdeckter Ziele zu verbessern. Experimente auf dem LLVIP-Datensatz zeigen, dass der Algorithmus bei reduzierter Parameteranzahl mAP0.5, Präzision (Precision) und Rückruf (Recall) um jeweils 1,39 %, 2,21 % und 3 % verbessert und die Inferenzgeschwindigkeit deutlich erhöht. Generalisierungsversuche auf den Datensätzen NightSurveillance und Nightowls bestätigen die überlegene Leistung. Der Algorithmus verbessert unter Echtzeitbedingungen effektiv die Erkennungsgenauigkeit und senkt die Fehlalarme und verfügt über gute Robustheit und Praktikabilität.