Zur Bewältigung der Herausforderungen bei der Reifeerkennung von Zitrusbäumen unter natürlichen Bedingungen, wie der Schwierigkeit der Reifeunterscheidung, starker Überdeckung von Zweigen, Blättern und Früchten, hoher Modellkomplexität und begrenzten Ressourcen für die Bereitstellung, schlägt dieser Artikel einen leichten Algorithmus zur Reifeerkennung von Zitrusfrüchten auf dem Baum vor, basierend auf dem verbesserten YOLOv11, genannt YOLO-HiP. Zunächst wird das verbesserte HGNetv2-L-Netzwerk als Backbone-Netzwerk verwendet und mit einer schichtweisen Merkmalsextraktionsstrategie kombiniert, was die Analysefähigkeit des Modells in komplexen Szenen deutlich verbessert und gleichzeitig die Rechenkomplexität und den Ressourcenverbrauch effektiv reduziert. Zweitens wurde ein leichter hybrider Aufmerksamkeitsmodul C2PSA_iRMB entwickelt, der den C2PSA-Mechanismus mit dem iRMB-Modul kombiniert, um die Rechenkosten zu optimieren und die Verarbeitung von Langstreckeninformationen zu verstärken, wodurch die Flexibilität und Recheneffizienz des Moduls erhöht wird. Schließlich wurde das C3k2_PConv-Modul entwickelt, das durch Reduzierung redundanter Berechnungen und Speicherzugriffe die Effizienz der räumlichen Merkmalsextraktion weiter verbessert. Die experimentellen Ergebnisse zeigen, dass YOLO-HiP eine mAP50 von 94,3 % erreicht, was eine Steigerung von 4,7 % gegenüber dem Originalmodell darstellt, bei nur 5,1 Millionen Parametern (Reduktion um 45,7 %), einer Berechnungsmenge von 13,9 GFLOPs (Reduktion um 34,7 %) und einer Bildrate von 227,4 fps (Steigerung um 25,1 %). Dieses Modell bietet eine innovative und praktikable Lösung für Plattformen eingebetteter Systeme mit begrenzten Rechenressourcen, wie Zitrus-Erntemaschinen, und gewährleistet gleichzeitig hohe Erkennungsgenauigkeit sowie eine signifikante Modellkomprimierung.