分享好友 最新动态首页 最新动态分类 切换频道
Xilinx的智能门控时钟技术你了解吗?
2024-12-27 12:31

文章目录

Xilinx的智能门控时钟技术你了解吗?

        写在前面

        摘要

        智能时钟门控

        额外优化

        设计实现流程中的智能时钟门控

        基准测试结果

        总结


        在FPGA和ASIC设计中,时钟信号通常都是翻转频率非常高的信号,而电路的翻转本质是电容的充放电,这也就是时钟信号带来的电路功耗。在低功耗设计中,通过使用使能信号控制时钟信号在不必要的时候被禁用,从而减少系统功耗,此类方法也被称为门控时钟技术。

        传统的门控时钟,需要设计人员在RTL中自己设计。xilinx自7系列起,在其大多数逻辑元素(如FF,BRAM,SRL等)中,均添加了使能管脚CE,设计人员只需要在RTL中使用综合属性(* gated clock =“true”*,或者设置综合策略gated_ clock_conversion”为auto即可由vivado自动推断出门控时钟逻辑。同样的,也可以通过源语BUFGCE来直接指定门控时钟。这无疑给我们的设计带来了很大的方便。

        本文主要翻译自Xilinx《WP370,Reducing Switching Power with Intelligent Clock Gating》浅蓝色字体为本人理解


        Xilinx提供了第一个自动化、细粒度的时钟门控解决方案,可在7系列和Zynq 7000设备中降低最高达30%的动态功耗。Xilinx智能时钟门控优化会在整个设计中自动执行,不会向设计流程引入新工具,也不会对现有逻辑或时钟产生改变设计行为的更改。而且,在大多数情况下,时序也会被保留。


        时钟门控是一种很好理解的功率优化技术,用于ASIC和FPGA设计,以消除不必要的开关行为。这种方法通常需要设计者在他们的RTL代码中添加少量的逻辑来禁用或取消不必要的活动时序单元--例如寄存器。尽管这种方法明显降低了动态功率,但在尝试手动实现这些优化时,设计人员仍面临着重大挑战

  • 真正减少设计中的活动需要深入了解设计本身,且通常需要对RTL进行大量更改
  • 目前,大多数ASIC和FPGA设计都包含一些新的设计、遗留的设计和第三方IP电路设计的组合,但通常只有新的设计是时钟门控优化的候选。设计人员很少尝试在遗留的设计和IP设计上进行这些优化。他们通常对遗留RTL代码的设计和操作没有足够深入的了解,并且需要大量的时间来手动开发时钟门控优化
  • 应用时钟门控优化通常需要在设计流程中添加更多的工具和更多的设计流程,并可能导致创建一组复杂的新时钟,需要进行复杂的时序分析(ASIC优化通常就是这样)。除非功耗效率的提高对设计的成功是必要的,否则额外的复杂度和时间可能会令人望而却步,并徒增风险

        意思就是你自己设计搞门控时钟,是又费资源又费时,还需要对自己的设计底层非常了解,不如直接使用我们xilinx的智能门控时钟技术,不需要改RTL,也不会动你的时序,多方便啊

        Xilinx具有与位置和布线标准设计流相链接的自动化功能,该功能使用一组创新算法对设计的所有部分(包括遗留和第三方IP模块)执行分析。对逻辑进行分析等同于在每个时钟周期寻找对结果无用的源寄存器,软件利用在可用逻辑中丰富的时钟使能(CEs)资源来创建时钟门控信号,以消除多余的开关行为,如图1所示。

 

        每个CE都非常适合进行功率优化,因为它连接到基本逻辑簇(Slice)。CE只控制少量寄存器(8个),提供与绝大多数设计使用的总线的最小尺寸相匹配的粒度级别(请参见图2)。

 

        需要注意的是,这些优化不会改变现有的逻辑或时钟位置,也不会创建新的时钟。最终的设计在逻辑上与原始设计相当,并且创建的额外逻辑与之前的逻辑是分开的,在原始设计中只增加了约2%的Lut消耗(平均而言)。因此,优化在绝大多数情况下不会影响时序,因为它没有向原始逻辑路径添加新的逻辑级数。

        其实就是每个时序逻辑器件都有使能端CE,只要你写的RTL符合要求,我们都能直接将其推断到CE端,不会产生额外的逻辑。


        智能时钟门控优化还降低了在简单或双端口模式下专用块RAM(BRAM)的功耗。这些BRAM提供了几个使能信号:array enable,write enable和output register clock enable。节省的大部分功耗来自于使用array enable信号,如图3所示。

        例如,在一个块RAM后面是一个2对1的多路复用器,优化在LUT中实现了一个OR函数,带有写使能(weR)和选择控制(preselectR),并将它们连接到BRAM的ENARDEN。OR函数确保当没有数据写入和输出不被使用时(即没有在多路复用器中选择)时,BRAM消耗更少的能量。假设块RAM的写启用的切换率为50%,此优化显示动态功率减少了26%。

        下面是Verilog代码的一个示例:

 

        在该软件的同一个版本中,这些优化可以检测作为逻辑实现的时钟使能,并将其替换为专用的CE信号,如图4所示。


        Vivado设计组件(v2013.1及以后)将智能时钟门控优化整合到设计实现流程中。所有的黑盒和IP也都经过了优化。在综合后的opt_design阶段默认执行BRAM功耗优化的一个子集。这些优化的重点是在保持性能的同时最小化BRAM的功耗。

        在opt_design阶段之后的power_opt_design步骤中(可选)可以使用更广泛的功耗优化,包括额外的BRAM功耗优化以及寄存器和移位寄存器(SRL)优化。它可以通过项目设置对话框中的Power Opt设计下的is_enabled选项启用。在功耗优化后,用户可以照常运行布局和布线。参见图5。

        默认情况下,功耗优化工作在整个设计阶段。但是,存在一些特殊的约束,可以对设计的某些部分(如模块、时钟域或实例类型(如BRAM))进行更有针对性的优化。

        好消息是,这个优化选项默认是打开的。 


        智能时钟门控的好处因设计而异:一些设计显示出显著的节能效果,而另一些则不然。有效性取决于用户是否已经优化了功耗的设计,以及设计是否具有符合时钟门控的逻辑结构。客户设计结果显示,动态功率降低最高达30%,平均可降低18%。参见图6。


        Vivado设计组件提供的智能时钟门控优化功能大大简化了FPGA设计中降低动态功率的工作。ASIC设计中使用的传统时钟门优化方法预设了对设计的深入了解,从而几乎排除了对遗留和第三方IP块的优化。通常需要新的工具、新的步骤和复杂的时间分析来补偿不可避免的新的“门控时钟”和产生的逻辑变化。相比之下,Xilinx智能时钟门控优化自动优化整个设计(或一部分),且没有引入新的工具或流程(相比默认流程),也不会对现有逻辑和时钟、时序产生改变。

最新文章
華為巴黎旗艦店舉辦GoPaint全球創作活動
/美通社/ -- 華為在其巴黎旗艦店(巴黎歌劇院旁)成功舉辦了GoPaint全球創作活動。本次活動由兩位才華橫溢的插畫師Mayada和Kenza主導,旨在通過可在華為MatePad系列設備上使用的GoPaint應用展現數字藝術的潛力以及實現創作的便捷性。該活動
科技通报“小拉抢单器新款怎么用教程”其实确实有挂
小拉抢单器新款怎么用教程是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。抢单可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义抢单系统规律,只需要输入自己
盘点即将上市的新款手机 你更喜欢哪一款?
点击上方电脑爱好者关注我们转眼2019年已经过半,手机圈的竞争也即将进入下半场,5G、折叠屏、UFS3.0、屏幕摄像头、全身无开孔设计等元素都会一一在新品中呈现。作为消费者,咱们暂时无需将目光投的太远,如果聚焦当下,将于近期上市的新款
高效SEO排名神器,助您网站流量翻倍,率飙升
推荐一款SEO快速排名软件,助您高效优化网站,快速提升流量与,让您的网站在搜索引擎中脱颖而出。随着互联网的快速发展,越来越多的企业开始重视网络营销,而SEO(搜索引擎优化)作为网络营销的重要组成部分,已经成为了企业提高网站流量、
深圳一医生被曝拒诊,耽误患者!官方回应 | 医脉3分钟
今天的医疗圈发生了哪些与你有关的大事?更新、更全的医学动态3分钟一网打尽今日关键词:韩语学生,轻断食,职业病类别,创新医疗器械来源 | 医脉通作者 |晚报君新闻60秒➤76岁老人被接到医院“免费”做手术,家属投诉并质疑医院@第一帮帮
潮州企业网站排名优化,提升品牌影响力的关键策略,潮州 企业
潮州企业网站排名优化是提升品牌影响力的重要策略。通过优化网站内容、提升用户体验、加强社交媒体营销、建立优质外链等方式,可以提高网站在搜索引擎中的排名,从而吸引更多潜在客户。定期更新网站内容、优化关键词、提高网站速度等也是关
漫画台苹果版免费
在众多的漫画阅读平台中,“漫画台”作为其中一个优秀的漫画阅读渠道,深受大家的喜欢和青睐。为了给更多的用户提供便捷、流畅的手机阅读体验,“漫画台”推出了全新的苹果版(iphone)应用,用户可以轻松在苹果商店中免费下载。下面就让我
用AI挑战5分钟一篇PPT!Kimi的这个功能绝了!打工人福音,效率提升80%!(附教程)
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~俗话说,在职场,不管干得怎么样&
词典分词算法详解:从基础到高效实现
2. 词典分词 2.1 什么是词2.2 词典2.3 切分算法2.4 字典树2.5 基于字典树的其它算法2.6 HanLP的词典分词实现中文分词:指的是将一段文本拆分为一系列单词的过程,这些单词顺序拼接后等于原文本。中文分词算法大致分为基于词典
从销售到 AI 算法工程师 | 转行人工智能大模型(含面经&裁员幸存指南)
我叫王东,90后,和大家分享一下我的人工智能转型之路。 农学毕业,投身互联网做销售 机遇难求,养殖梦碎 我是土生土长的农村人,小时候经常和小鱼小虾打交道,上大学的时候就选择了农学专业,
相关文章
推荐文章
发表评论
0评