التعرف على المشاهد بناءً على تعلم العمق والتقسيم الدلائل العميقة

JIA Xuan ,  

ZHANG Ye ,  

CHANG Xuling ,  

SUN Jianbo ,  

摘要

لمواجهة مشكلة انخفاض معدل التعرف على صور السيناريو التي تحمل اختلافات فئوية دقيقة وتصنيف غير واضح داخل الفئة. تم تقديم إطار جديد لتقسيم المعنى. من خلال إدخال تعلم القياس العميق ، تركز على العلاقات الفردية للبكسلات ، وتحسين دقة التعرف على النموذج. أولاً ، من خلال موديل الهرم الشبكي الفارغ لتجريد الميزات ، ثم خلال عملية فك التشفير من خلال استخدام دمغة الهيكل ذات الدقة العالية والميزات ذات الدقة المنخفضة لاستعادة التفاصيل والحدود الدقيقة في الصورة بشكل أفضل. ثم في فصل التعلم المترابط العميق ، تم تضمين فراغ التضمين الصرف للبكسلات من خلال تعلم الهيكل الجيد للمساحة الصرفية ، من خلال تكبير المسافة الأقل بين بكسلات الفئات المختلفة وتقليل المسافة الأقل بين بكسلات نفس الفئة ، وتصنيف البكسلات بشكل فعال. وأخيراً ، باستخدام خسارة التركيز وخسارة التباين الوزنية المركبة ، توازن أهمية العينات المختلفة بينها ، مما يقيس أداء النموذج بدقة أكبر ويعزز دقة التعرف على السيناريو وقوة التحمل. تؤكد النتائج التجريبية أن النموذج يحتل المرتبة 47.6% و 83.1% على التوالي في مجموعة البيانات المفتوحة ADE20K و Cityscapes.

关键词

تعلم عميق ؛ تعلم عميق المقياس ؛ تقسيم المعنى ؛ التعرف على المشاهد ؛ التفاوت في الفئة

阅读全文