Angesichts der Herausforderungen bei der Unterscheidung des Reifegrads von Zitrusbäumen in natürlichen Umgebungen, der starken Überdeckung von Zweigen und Früchten, der hohen Modellkomplexität und begrenzten Ressourcen für die Bereitstellung, schlägt dieser Artikel einen leichtgewichtigen Algorithmus zur Reifeerkennung von Zitrusfrüchten auf dem Baum basierend auf einer verbesserten YOLOv11-Version namens YOLO-HiP vor. Zunächst wird das verbesserte HGNetv2-L-Netzwerk als Backbone verwendet, kombiniert mit einer hierarchischen Merkmalsextraktionsstrategie, die die Analysefähigkeit des Modells in komplexen Szenen erheblich verbessert und gleichzeitig die Rechenkomplexität und den Ressourcenverbrauch effektiv reduziert. Zweitens wurde das leichtgewichtige Hybrid-Attention-Modul C2PSA_iRMB entwickelt, das den C2PSA-Mechanismus mit dem iRMB-Modul kombiniert, um Rechenkosten zu optimieren und die Verarbeitung von Langstreckeninformationen zu verbessern, was die Flexibilität und Recheneffizienz des Moduls erhöht. Schließlich wurde das Modul C3k2_PConv entwickelt, das durch Reduzierung redundanter Berechnungen und Speicherzugriffe die Effizienz der räumlichen Merkmalsextraktion weiter steigert. Experimentelle Ergebnisse zeigen, dass YOLO-HiP eine mAP50 von 94,3 % erreicht, was eine Steigerung um 4,7 % gegenüber dem ursprünglichen Modell darstellt, mit nur 5,1 Millionen Parametern (Reduktion um 45,7 %), einem Rechenaufwand von 13,9 GFLOPs (Abnahme um 34,7 %) und einer Bildrate von 227,4 fps (Steigerung um 25,1 %). Dieses Modell gewährleistet eine präzise Erkennung bei gleichzeitiger signifikanter Modellkomprimierung und bietet eine innovative und praktikable Lösung für Plattformen mit begrenzten Rechenressourcen, wie integrierte Zitrusernte-Roboter.