Исходя из ограничений вычислительной мощности аппаратной платформы и ресурсов хранения, реализация энергоэффективных и эффективных сверточных нейронных сетей (CNN) с использованием встроенных систем по-прежнему остается основным вызовом для аппаратного проектирования. На основе этого в статье предлагается полное проектирование гетерогенной встроенной системы на базе программно-конфигурируемого массива вентильных вентилей (SoC). Этот дизайн использует каскадную структуру мультиплексирования входов, в то же время выполняет две независимые операции умножения и аккумуляции в одном DSP, что снижает доступ к внешней памяти, повышает эффективность системы и снижает энергопотребление, повышая эффективность мощности на 38,7% и более по сравнению с другими вариантами. Этот дизайн (фреймворк) в конечном итоге был успешно развернут на крупных сетях CNN на недорогих устройствах, значительно повышая эффективность питания модели сети, даже до 102 Gops / W на устройстве ZYNQ XC7Z045. Кроме того, при использовании этой конструкции для вывода сверточного слоя модели VGG-16 частота кадров может достигать 10,9 кадров в секунду, что полностью демонстрирует, что этот дизайн в ограниченной среде энергопотребления может эффективно ускорять вывод сверточных нейронных сетей.