تعد تتبع الهدف الفردي واحدة من المهام الهامة في رؤية الحاسوب، حيث تهدف إلى تحديد موقع الهدف بدقة في تسلسل الفيديو. على الرغم من أن التعلم العميق دفع بتطور سريع في مجال تتبع الهدف الفردي، إلا أن مشكلات مثل تشوه الهدف والخلفية المعقدة والتظليل وتغير المقياس ما زالت تشكل تحديات. يقوم هذا المقال بمراجعة شاملة لطرق تتبع الهدف الفردي القائمة على التعلم العميق في السنوات العشر الأخيرة، ويشمل طرق النمذجة التسلسلية التقليدية التي تعتمد على الشبكات العصبية التابعة والشبكات العصبية الدورية والشبكات العصبية الثنائية المختلطة المعتمدة على الشبكات العصبية التابعة ومعمارية Transformer والطرق الأحدث المعتمدة بشكل كامل على Transformer. يقوم هذا المقال بتقييم وتحليل أداء مختلف الخوارزميات على مجموعات بيانات مثل OTB100 وLaSOT وGOT-10K من حيث الدقة والصلابة وكفاءة الحساب، ويتطلع إلى الآفاق البحثية لخوارزميات تتبع الهدف الفردي القائمة على التعلم العميق.
关键词
تتبع الهدف الفردي؛ تتبع الأهداف البصرية؛ التعلم العميق؛ الشبكات العصبية التابعة