#每天一篇论文 329/365 EyrISV2:一种用于移动设备上深度神经网络的柔性加速器(一)

news/2024/4/24 4:47:07/
Eyeriss v2: A Flexible Accelerator for Emerging Deep Neural Networks on Mobile Devices

每天一篇论文汇总list

摘要

深度神经网络(deep neural network,DNN)发展的一个最新趋势是将深度学习应用扩展到资源和能量更为受限的平台,例如移动设备。
这些努力旨在减小DNN模型的尺寸,提高硬件处理效率,并使DNN具有更紧凑的结构和/或更高的数据稀疏性。这些紧凑或稀疏模型不同于传统的大型模型,因为它们的层形状和大小有更多的变化,并且常常需要专门的硬件来利用稀疏性来提高性能。因此,许多为大型DNN设计的DNN加速器在这些模型上性能不佳。在这项工作中,我们提出了eyerisv2,一个DNN加速器架构,设计用于运行紧凑和稀疏DNN。为了处理广泛变化的层形状和尺寸,它引入了一种高度灵活的片上网络,称为层次网格,它能够适应不同数据类型的数据重用和带宽需求的不同数量,从而提高计算资源的利用率。此外,Eyeriss v2可以直接在压缩域中处理稀疏数据,从而提高稀疏模型的处理速度和能量效率。总的来说,在稀疏MobileNet的情况下,65nm CMOS工艺中的eyerisv2在批量大小为1的情况下实现1470.6个推论/秒和2560.3个推论/J的吞吐量,比运行MobileNet的原始eyeris快12.6倍,能效高2.5倍。

贡献

本文通过设计高度灵活的片上网络(NOC)来实现的,这是目前处理更多样的DNNS的瓶颈。此外,Eyeriss v2还通过利用各种DNN层中权重和激活的稀疏性来支持稀疏DNN,并将其转化为在能效和处理速度方面的改进。最后,与原来的Eyeris类似,Eyeris v2没有对DNN层所需的总存储容量是否适合芯片进行任何假设,而是优化了不同类型数据的分片方式,实现了芯片的高重用和高能效。总之,本文的贡献包括:
1.一种新型的NoC,称为分层mesh,旨在适应广泛的带宽需求。当数据重用率较低时,它可以从存储器层次提供高带宽(通过单播),以保持PEs的忙碌;当数据复用率较高时,仍然可以利用空间数据复用(通过多播或广播)来实现高能效。对于像MobileNet这样的紧凑型DNN,分层网格增加了5.6倍的吞吐量和1.8倍的能量效率。
2.利用权重和激活的稀疏性,在各种DNN层上提高吞吐量和能效的PE。数据以压缩稀疏列(compressed sparse column,CSC)格式保存,用于片内处理和片外访问,以降低存储和数据移动成本。将权重映射到PE通过考虑稀疏性来提高PE内部的重用性,从而可以减少工作负载不平衡的影响。总体而言,利用稀疏性可使MobileNet的吞吐量和能效分别提高1.2倍和1.3倍。
3.运行稀疏MobileNet的eyeris v2比原来的eyeris快12.6倍,能效高2.5倍(扩展到与eyeris v2相同的PEs数量和存储容量),即运行MobileNet(49.2M MACs)的eyeris v1。与运行AlexNet(724.4M Mac)的Eyeriss v1相比,使用稀疏AlexNet的Eyeriss v2速度快42.5倍,能效高11.3倍。最后,运行稀疏MobileNet的eyerisv1比运行AlexNet的eyerisv1快225.1倍,节能42.0倍。很明显,支持稀疏和紧凑dnn对速度和能耗有显著影响。

方法

http://www.ppmy.cn/news/600096.html

相关文章

用于光学神经网络的高速光学卷积加速器

用于光学神经网络的高速光学卷积加速器 导读一、工作原理二、矩阵卷积加速器三、光学卷积神经网络3.1 卷积层实现3.2 全连接层的实现3.3 测试结果 导读 受生物视觉皮层系统启发的卷积神经网络能够提取原始数据的分层特征,以大大降低参数复杂性并提高预测的准确性。它…

优化基于FPGA的深度卷积神经网络的加速器设计

英文论文链接:http://cadlab.cs.ucla.edu/~cong/slides/fpga2015_chen.pdf 翻译:卜居 转载请注明出处:http://blog.csdn.net/kkk584520/article/details/47450159 【0. 摘要】 CNN已经广泛用于图像识别,因为它能模仿生物视觉神…

【AUTOSAR】CCP协议的代码分析与解读(九)----CCP协议源码分析和实例分析

CCP协议在ECU中的应用 CCP协议是基于CAN总线的ECU标定协议,在对ECU进行标定和测试前,必须先在ECU内部实现支持CCP协议的程序,使ECU能够接收并发送符合CCP规范的CRO和DTO,并能够对接收到的CRO命令进行解释并执行,这就是…

基于FPGA的深度卷积神经网络的加速器设计

英文论文链接:http://cadlab.cs.ucla.edu/~cong/slides/fpga2015_chen.pdf 翻译:卜居 转载请注明出处:http://blog.csdn.net/kkk584520/article/details/47450159 【0. 摘要】 CNN已经广泛用于图像识别,因为它能模仿生物视觉神…

解决 Xbox Series S/X 连接无线校园网的问题

通常地,在校的寝室或办公室没有安装路由器,且手机热点不足以支撑Xbox的流量需求,在校学生党只能无奈选择连接校园无线WIFI来实现自己的游戏梦。但是,问题就在于——需要网页认证的校园网连接无法在Xbox上实现,那该怎么…

【AUTOSAR】CCP协议的代码分析与解读(八)----CCP协议应用流程

CCP协议应用流程 主从设备建立逻辑连接 按照CCP协议,当主设备需要用某个ECU通信时,必须首先与ECU建立连接。CCP建立连接的步骤如下: 按地址Tester与ECU建立逻辑连接:CONNECT统一从、主设备CCP协议版本:GET_CCP_VERSI…

【无标题】TI AM64x工业核心板规格书(双核ARM Cortex-A53 + 单/四核Cortex-R5F + 单核Cortex-M4F,主频1GHz)

1 核心板简介 创龙科技SOM-TL64x是一款基于TI Sitara系列AM64x双核ARM Cortex-A53 单/四核Cortex-R5F 单核Cortex-M4F设计的多核工业级核心板,通过工业级B2B连接器引出5x TSN Ethernet、9x UART、2x CAN-FD、GPMC、PCIe/USB 3.1等接口。核心板经过专业的PCB Layo…

维优尚品——全国首家C2M电子商务平台

一、维优尚品是什么 维优尚品的概念:全国首家C2M电子商务平台 维优尚品,一个致力于向个人提供移动电子商务零售服务的轻创业平台。自2016年5月正式成立,维优尚品一直秉持着“让买卖更简单”的使命,坚持“精选优品、高效运营、优质…

一些关于TV的概念

一些关于TV的属于解释 TTX TTX是一种电视机上的文字广播系统,可以在电视屏幕上显示文字信息,如新闻、天气预报、股票行情、电视剧剧情介绍等。它是通过电视信号的一部分传输的,不需要额外的接收设备。 TTX最初在欧洲开发,被称…

PyQgis踩雷合集:打印布局layout无法通过QgsPrintLayout创建。(持续更新)

本人是照着pyqgis开发手册来学习开发的。 踩雷1:project项目初始化时,会出现打印布局layout无法创建的情况。 官方手册里的加载项目示例: # 如果你不在QGIS控制台内运行,首先需要导入qgis和PyQt类,如下所示&#xf…

linux pppoe配置文件,linux pppoe服务器配置

弹性云服务器 ECS 弹性云服务器(Elastic Cloud Server)是一种可随时自助获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率 三年低至5折,多种配置可选了解详情 什么是…

linux pppoe 拨号日志,PPPoe宽带拨号

0. 确认本机 linux 发行版以及系统版本1cat /pro/version 如输出1Linux version 3.10.0-862.el7.x86_64 (builderkbuilder.dev.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-28) (GCC) ) #1 SMP Fri Apr 20 16:44:24 UTC 2018 可看到是 Red Hat 4.8.5-28&#xff0…

PPPoE 报文实例

PPPoE是对PPP的扩展,提供了在以太网上建立PPPoE会话以及封装PPP数据帧的方法。 客户端:Shenzhen_a0:d5:51服务端:HuaweiTe_1c:bb:c8 完整报文如下: PPPoE Discovery PADT PADI PADO PADR PADS PPPoE Session session阶段又可细分为…

ensp-PPPoE实验

实验拓扑如下: 图片标识错误:PPPoE服务器的ip地址应该是202.100.1.2/24 AR1: 客户端配置 [Huawei]sysname AR1 [AR1]dialer-rule #进入dialer-rule视图 [AR1-dialer-rule]dialer-rule 1 ip permit #允许ip流量触发拨号 [AR1-dialer-rule]qu [AR1]interface …

HCIA网络基础18-PPPoE

文章目录 DSLPPPoE报文会话建立PPPoE配置 DSL 数字用户线路DSL(Digital Subscriber Line)是以电话线为传输介质的传输技术,人们通常把所有的DSL技术统称为xDSL,x代表不同种类的数字用户线路技术。目前比较流行的宽带接入方式为ADSL,ADSL是非…

linux中pppoe技术分析,Linux中PPPOE技术分析

一、PPP协议介绍 1.PPP协议的组成 PPP协议包括两部分组成:一部分是数据链路控制协议(LCP);另一部分是网络控制协议(NCP)。 2.PPP链接的过程分析 PPP链接的建立过程分为三个阶段:创建,认证和网络协商阶段。创建阶段主要是工作是对基本的通信方式进行选择,链路两端的设备通过…

PPPoE讲解

目录 PPPoE建立协商过程 Discovery:(4个部分) Session-PPPoE会话阶段(2部分)都是单播发送 Terminate:结束会话 PPPoE报文 PPPoE的两种拨号方式 共享DCC 轮询DCC PPPoE是以太网上的点对点协议&#…

pppoe linux 配置文件,arm-linux配置pppoe

1.1 pppoe概述 1.1.1什么是PPP PPP是点对点协议(Point to Point Protocol)的缩写。它是TCP/IP网络协议包的一个成员。PPP是TCP/IP的扩展,它增加了两个额外的功能组:它可以通过串行接口传输TCP/IP包; 它可以安全登录 当使用作为公共电话系统的部分的串行接口时,必须要注意确…

嵌入式移植使用pppoe

PPPoE官网:RP-PPPoE | Roaring Penguin 源码下载地址:Dianne Skolls Personal Web Site - RP-PPPoE - Software Projects Ubuntu 启动PPPoE服务: 解压后源码 编译Ubuntu下的PPPoE 在源码路径下进入src 执行configure 进行配置生产Makefile …

Qt6 FFmpeg入门1 - 环境配置

目录 环境配置ffmpeg 下载qt 配套环境配置代码测试 环境配置 文章更新时间:2023/06/24 ffmpeg 下载 由于大部分的关于配置 ffmpegqt 环境的文章都停留在 2021 年,且许多方法均已过时,现在介绍一个最新的方法,并分析槽点供大家参考…