java高性能低功耗计算_实现低功耗的高性能深度学习

对于大多数功耗敏感型的嵌入式视觉应用而言 , 搭载专用CNN引擎的视觉处理器可 能是能否满 足设计功 耗 预算的关键区别因素。选择专用CNN引擎似乎是一件理所应当的事情 , 但如何在芯片实现之前就测量 出 功 耗呢?

我们假设一项应用的性能阈值对功耗预算有严格要求,例如电池供电的物联网 智能家居或运 行面部识别 功 能的移动设备。根据所需要的帧大小、帧速率和其他参数的不同,面部识别 可能需要数百 GMAC/s的嵌入 式视觉处理能力。ASIC或SoC设计现在必须寻找到一种嵌入式视觉解决方案 , 其能够在设计的 功耗预算内 执行该网络 – 比如说 , 功耗预算为几百mW。

遗憾的是,对不同的视觉处理器IP进行比较并不是一件简单的事情。这些刚刚崭露头角(bleeding edge)的 IP解决方案通常还没有形成芯片,而且每一种实现方式都互不相同,因此很难计 算和比较不 同IP选项之间 的功耗或性能。在比较CNN解决方案时没有可以使用的基准测试标准。FPGA原型平台或许可以提供准确的基准测试结果,但并不能提供准确的功耗估计。

计算功耗的一种方法是运行基于RTL或Netlist的仿真来捕获所有逻辑的翻转。利用设计的布局 , 这些信息可 以提供很好的功耗估计。对于较小规模的设计 , 这种仿真可以在几个小时内完成 (例如,在嵌入式RISC 内核 上运行CoreMark或Dhrystone)。对于大型设计 , 这种仿真运行较为缓慢。 对于需要高 帧速率的较大 CNN图 形,一次模拟可能需要几周时间才能达到稳定状态来测量功耗。 如果IP供应 商跳过此类费时费力 的功耗测 量 , 转而采用较小规模的仿真模型通过一些捷径来估计功耗 , 则会存在真正的风险 , 从而将问题推向下 游交 给SoC供应商 , 让他们在IP供应商的功耗分析声明上签字了事。

Synopsys的ZeBu 服务器(图2)为IP开发人员和SoC设计人员分析 及测量功耗提供了巨大 的便利。 ZeBu服 务器是业界最快的仿真系统,可以用于完整SoC设计 , 支持多种先进的使用模式 , 包括电源管理验证、全面 调试和Verdi集成、带虚拟原型和架构探索的混合仿真 , 以及优化。 ZeBu有额外 的功能可以确定 所有触 发 器的翻转率,然后将其反标到真实的硬件上 , 以准确计算功耗。 Synopsys使用该功能可以确保为其嵌入 式 视觉处理器提供最高精确程度的功耗估算。SoC设计人员可以使用ZeBu来优化系统中所有元件的功耗。这可以帮助把运行RTL仿真进行功耗仿真的时间从数周缩短到数小时。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/421516.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ 虚函数在基类与派生类对象间的表现及其分析

近来看了侯捷的《深入浅出MFC》,读到C重要性质中的虚函数与多态那部分内容时,顿时有了疑惑。因为书中说了这么一句:使用“基类之指针”指向“派生类之对象”,由该指针只能调用基类所定义的函数,如果要让基类的指针使用…

Android---什么是3G

学习安卓之前我们必须了解什么是3g.这几年随着IT技术的革新。移动互联网已经渐渐的占据了市场的主导地位。而3g技术是移动互联网的一方面体现。那么究竟什么是3g? 3G有三大制式,GSM升级后的WCDMA,CDMA升级后的CDMA2000,以及我国自主开发的TD…

centos7硬盘挂载mysql_centos7 挂载新磁盘

一 、挂载新磁盘查看磁盘[rootlocalhost ~]# fdisk -lDisk /dev/vda: 53.7 GB, 53687091200 bytes, 104857600 sectorsUnits sectors of 1 * 512 512 bytesSector size (logical/physical): 512 bytes / 512 bytesI/O size (minimum/optimal): 512 bytes / 512 bytesDisk lab…

autolisp 列表 resbuf

有以下 list : (1 2 3 (4 5 6) "Properties" (("id" . 3) ("name" . "hello lisp"))) 要求用: quote cons acutBuildList acutNewRb 方式构造 转载于:https://www.cnblogs.com/pangblog/p/3331246.html

如何看懂php源程序,概述 · thinkphp5.0 源码阅读学习 · 看云

**1 章节简介**概述: 记录框架的文件,类,函数或方法等索引到文章的具体章节,方便查找。框架流程:框架流程的重要文件分析。框架工具:框架自带的重要工具文件分析。框架驱动:框架底层的驱动与扩展目录分析。…

php评论盖楼怎么实现,dedecms评论盖楼实现楼层数,类似腾讯、网易的评论(5.5/5.6版)...

DEDE评论效果:修改后的效果:修改步骤一、织梦dedecms5.5版本(5.6版本请往下看)1、修改/plus/feedback_ajax.php文件的第131行(如果你没改过)下面是修改之前的代码:$qmsg {quote}{title}.$row[username]. 的原帖:{/title}{content…

Nokia 920全部CODE

code码都是7位,我是从别的地方copy过来的,code码后面带了些乱码懒得删了,自己数7位code就是了。 RM-820 NDT AMERICA ATT White 059N5T3RM-820 NDT AMERICA ATT Yellow 059N5T5RM-820 NDT AMERICA ATT Black 059L848RM-…

datagridview绑定与详细说明 (搜集)

1、实现一个用于处理数据库教程数据检索的详细信息的方法。 下面的代码示例实现一个 getdata 方法,该方法对一个 sqldataadapter 组件进行初始化,并使用该组件填充 datatable。 然后,将 datatable 绑定到 bindingsource 组件。请确保将 conne…

matlab显示二值直方图,图像灰度变换、二值化、直方图

1、灰度变换1)灰度图的线性变换Gnew Fa * Gold Fb。Fa为斜线的斜率,Fb为y轴上的截距。Fa>1 输出图像的对比度变大,否则变小。Fa1 Fb≠0时,图像的灰度上移或下移,效果为图像变亮或变暗。Fa-1,Fb255时,发…

Delphi XE2 之 FireMonkey 入门(13) - 动画(下)

TAnimation 类的主要成员: protectedfunction NormalizedTime: Single; //procedure ProcessAnimation; virtual; //其子类们主要通过覆盖此方法来实现不同的动画procedure Loaded; override; // publicprocedure Start; virtual; //播放procedure…

mysql 触发器 插入或者更新,MySQL 在触发器里中断记录的插入或更新?

下面是一种实现的方法。思路就是想办法在触发器中利用一个出错的语句来中断代码的执行。mysql> create table t_control(id int primary key);Query OK, 0 rows affected (0.11 sec)mysql> insert into t_control values (1);Query OK, 1 row affected (0.05 sec)mysql&g…

BZOJ 1601 [Usaco2008 Oct]灌水 (最小生成树)

题意 Farmer John已经决定把水灌到他的n(1<n<300)块农田&#xff0c;农田被数字1到n标记。把一块土地进行灌水有两种方法&#xff0c;从其他农田饮水&#xff0c;或者这块土地建造水库。 建造一个水库需要花费Wi(1<Wi<100000),连接两块土地需要花费Pij(1<pij<…

matlab mxarray array,[Matlab]MxArray与MwArray使用区别

引子在外部编程语言与matlab的交互中&#xff0c;Array是最单元的交互元素&#xff0c;怎么都绕不过去。在matlab提供的Array接口有两个&#xff0c;一个是C的MxArray, 另一个是Cpp(C)的MwArray.看下两着的分别介绍&#xff1a;mxArray&#xff1a;Matlab C 函数库的结构体mwAr…

NSARRAY的 内存管理

一个对象加入到nsarray里内存计数器会1,当这个nsarrayrelease的时候,回自动减1,程序员不需要管理这方面的内存.转载于:https://www.cnblogs.com/gm-lotus/p/3349509.html