为什么做免费视频网站网站内容页相关性怎么做
news/
2025/9/26 12:32:27/
文章来源:
为什么做免费视频网站,网站内容页相关性怎么做,厦门网站建设哪家好,网站虚拟空间多少钱目前#xff0c;市场上的芯片主要包括指令集架构和数据流架构两种实现方式。指令集架构主要包括X86架构、ARM架构、精简指令集运算RISC-V开源架构#xff0c;以及SIMD架构。总体来说#xff0c;四者都属于传统的通用指令集架构。传统的指令集架构采用冯诺依曼计算方式#…目前市场上的芯片主要包括指令集架构和数据流架构两种实现方式。指令集架构主要包括X86架构、ARM架构、精简指令集运算RISC-V开源架构以及SIMD架构。总体来说四者都属于传统的通用指令集架构。传统的指令集架构采用冯诺依曼计算方式通过指令执行次序控制计算顺序并通过分离数据搬运与数据计算提供计算通用性。与上述四者不同数据流架构采用了数据流引擎的计算架构它的显著特点就是能够大幅提高芯片利用率。如鲲云的CAISACustom AI Streaming Accelerator Architecture就采用了定制化的数据流架构。那么究竟什么是数据流架构呢它又是怎么实现性能的极大提升呢数据流架构是一种计算机体系结构直接与传统的冯·诺依曼架构或控制流体系结构进行对比数据流架构没有概念上的指令计数器。它使用粗粒度表示Coarse-grained Representation来提高数据的并行度并允许编译器同时调度多个顺序循环和功能以实现更高的吞吐量和更低的延迟。下图显示了数据流流水线的概念图。在这个概念图中指令集架构首先执行函数A完成之后再执行函数B依次类推直至执行完所有程序。在定制数据流架构的情形下编译器可以安排每个函数在数据可用时立即执行。在此示例中指令集架构图A等待时间和间隔为8个时钟周期。使用数据流架构该间隔可减少到仅三个时钟周期图B。目前数据流架构已在专用硬件中成功应用例如数字信号处理、网络路由、图形处理、遥感检测、以及数据库处理等。同时在当今的许多软件体系结构中包括数据库引擎设计和并行计算框架它也占据着非常重要的地位。1994年帝国理工学院教授、英国皇家工程院院士、鲲云科技联合创始人和首席科学家Wayne Luk陆永青院士率先将数据流架构定制化并运用到AI领域。首先现在大部分的 GPU、CPU 都是基于指令集的架构应用层可以通过软件和编辑器去将语言最终转化为机器的语言即二进制的码从而执行指令和操作并保证对不同应用的兼容性。相较于指令集数据流的核心就是使每个时钟周期都能进行有效计算。数据不停流入计算单元并完成计算得到输出后最终数据将会被存储到内存中或流入下一个流水线操作。简而言之数据流架构可以为特定应用场景提供更高的芯片利用率而指令集架构虽然能提供更高的通用性但其芯片利用率相对较低。两种架构产生差异的原因在于数据流架构完全依靠数据流转的方式来控制计算从而消除了由于指令控制和数据搬运而产生的数据开销指令集架构通过指令控制来处理不同场景下的运算提高了对不同计算需求的通用性支持。数据流架构要实现性能的极大提升需要解决两个问题一是如何在复杂计算架构下保持较高的计算效率二是如何保证定制架构的通用性即如何支持不同的深度学习算法。为此 鲲云研发了RainBuilder与CAISA架构配合通过动态配置使其能通用支持各种AI算法提升了通用性。该编译器能进行算法模型结构的解析并把模型导入数据流架构从而提高数据流架构的计算效率来完成深度学习网络的计算。RainBuilder的优势包括是一种端到端End-to-End的编译工具最大化 AI 性能充分利用数据流架构下的计算单元使用硬件流水线架构完成数据的计算与控制RainBuilder由RbCompiler、RbRuntime和RbDriver三部分构成。RainBuilder的原理如下图所示------RainBuilder Compiler下文称为RbCompiler或Compiler可以将用户在TensorFlow、Caffe、ONNX、PyTorch等深度学习框架下开发的算法模型进行全自动的编译优化并提取数据流中间表达式Streaming Graph IRSG IR。模型编译过程中自动进行数据量化、节点融合、软硬件分割等操作。Compiler通过鲲云研发的图优化算法将已有开发框架中的指令集计算图重构为数据流图。转化过程中涉及大量针对数据流架构的模型压缩和量化技术从软件层面进一步提升计算效率。------RainBuilder Runtime为CAISA加速引擎的软件运行时负责将SG IR进行加载并使用CAISA加速引擎对深度学习网络进行运行加速该部分组件以C/C API接口的形式开放给用户进行二次开发和部署使用。RbRuntime作为RainBuilder的后端配合RbCompiler使用用于加载并运行RbCompiler编译生成的模型文件即上文提到的SG IRSG IR包含了模型的所有节点并能根据节点创建对应的SG OP同时还能按照拓扑顺序将SG OP部署在相应的设备上执行计算返回模型的计算结果。Runtime提供深度学习算法的应用接口用户可根据使用习惯调用python或C/C的API完成算法的部署。Runtime设计了工作线程和计算线程精细化调度框架同时针对x86、ARM平台实现了算子的深度适配和优化从而保证目标算法可以充分发挥CAISA架构计算效率的优势。------RainBuilder Driver是底层CAISA架构的相关驱动模块对应用开发者透明驱动CAISA硬件架构实现硬件模块的计算调度和硬件模型分析。RainBuilder的推出简化了算法从开发到芯片级部署的流程。用户不需要了解底层计算架构也不需要改变开发习惯就可以实现算法在数据流架构上的高效部署。鲲云科技聚焦于基于数据流架构的定制AI计算引擎凭借自1991年近三十年技术积累2019年4月鲲云科技发布全球首个AI数据流架构CAISA 2.0架构其芯片利用率Chip Utilization RatioCUR 最高可达98并且支持大多数主流卷积神经网络CNN是世界上首个针对人工智能的数据流架构。基于自主研发的CAISA数据流架构鲲云的“星空”、“雨人”加速卡已在航空、航天、电力、安防、教育、智能制造、智慧城市等领域落地。References1. Veen, Arthur H.(Dec 1986). Dataflow Machine Architecture. ACM Computing Surveys.18 (4): 365–396. doi:10.1145/27633.28055. Retrieved 5 March 2019.2. HX300Family of NPUs and Programmable Ethernet Switches to the Fiber AccessMarket, EN-Genius, June 18 2008.3. ManchesterDataflow Research Project, Research Reports: Abstracts, September 19974.https://www.xilinx.com/html_docs/xilinx2017_4/sdaccel_doc/obx1504034310502.html
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/916798.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!