En el campo de la alerta aérea, la tecnología de detección de objetivos infrarrojos pequeños es crucial para la percepción del campo de batalla a larga distancia y en todas las condiciones climáticas. Para abordar el problema de la baja probabilidad de detección y la alta tasa de falsas alarmas causadas por la baja proporción de píxeles de los objetivos infrarrojos pequeños y la escasez de características en contextos complejos, se propuso un método de detección de objetivos infrarrojos pequeños en fondos complejos basado en una red convolucional tridimensional espaciotemporal. Este método propone una red troncal de extracción de características que combina convoluciones 2D y 3D, logrando una percepción colaborativa de la estructura del objetivo y los cambios temporales mediante la combinación de características de textura espacial y características de movimiento entre cuadros; basado en las características de los objetivos infrarrojos pequeños, se diseñó un módulo de contraste local para ampliar el campo receptivo y así mejorar las características; se introdujo un mecanismo de atención asimétrico para la fusión de características, aumentando la retención de información de textura y ubicación; finalmente, se calcularon los resultados de detección mediante una función de pérdida de regresión puntual. Los experimentos se llevaron a cabo en conjuntos de datos públicos y personalizados para entrenamiento y prueba. Los resultados muestran que el algoritmo mejorado, en comparación con las redes existentes de detección de objetivos infrarrojos pequeños, mejora la tasa de recuperación en no menos del 7,52% y la precisión promedio en no menos del 6,46%. Puede aplicarse eficazmente para la detección de objetivos infrarrojos pequeños en fondos complejos y demuestra buena robustez y adaptabilidad.