成为拥有核心技术的半导体元器件供应商和解决方案商
电话咨询(微信同号): +86 18926567115

新闻资讯

知识专栏

将人工智能融入低功耗芯片设计

作者: 浮思特科技2024-06-05 14:05:23

  随着对越来越小、功耗更低的电子设备需求的增长,低功耗芯片设计已经成为一个基本角色。人工智能在嵌入式系统中的日益普及,正挑战着低功耗芯片设计师们去融入更高密度、更具创新性的架构和制造工艺。为了满足AI芯片在功能性、可制造性、成本和可靠性方面的要求,合适的功率分析技术和工具是必要的。

  低功耗设计

  低功耗设计的目标是减少集成电路(IC)的整体动态和静态功耗,这是实现下一代应用的关键方面。这个过程涉及到减少动态和静态功耗。动态功耗包括开关和短路功率分析,而静态功耗主要包括泄漏电流分析。包含上述三种贡献的功率方程如图1所示。

低功耗芯片

图1

  在IC制造工艺基于90nm到16nm技术的那些年,设计师的注意力集中在减少泄漏功耗上,因为它比动态功耗(10%到15%)所占比重更大(85%到95%)。随着从16nm到14nm的过渡,功率方程发生了变化;泄漏功耗得到了很好的控制,而动态功耗变成了一个更重要的问题。这主要是由于从平面晶体管架构过渡到FinFET晶体管架构,一种在衬底上构建的多栅器件,其栅极位于通道的两侧、三侧或四侧,或包裹在通道周围,形成双栅甚至多栅3D结构。

  在未来几年,电子制造领域的不断进步将导致7nm、5nm甚至3nm的制造工艺,再次突显泄漏功耗的重要性。

  AI的新挑战

  AI在电子应用中的日益普及引入了新的功率挑战。性能、功率和面积(PPA)范式仍然是设计师要实现的目标。不同的是,随着AI芯片的引入,最大化功率变得更加困难而不牺牲功率。如今,性能实际上受到功率的限制,并且在不担心散热和热管理的情况下很难可靠地将功率传递到芯片的每个部分。

  定义为SoC在实际系统中工作时所见的现实活动的向量质量,对于动态功率分析和优化至关重要。

  “最大的问题是估计工作负载,特别是当SoC在实际系统中运行时,”Synopsys设计组的低功耗架构师兼研究员Godwin Maben说。“我们需要知道工作负载来测量和优化动态功率。涉及到AI时,没有预定义的基准。我们需要识别这些工作负载,确保它们被捕获并尽早调试功率。”

  低功耗设计意味着要理解功率在软件开发、硬件设计和制造过程中的影响。这不是一个单步活动,应贯穿整个芯片设计过程,旨在减少整体动态和静态功耗。

  如图2所示,设计和验证方法分为五个主要阶段:

  静态功率验证和探索

  动态功率验证和分析

  软件驱动的功率分析

  功率实现

低功耗芯片

图2

  仿真的作用

  提供SoC功耗估算是一项艰巨的任务,要求设计师设置能够尽可能真实地再现实际工作条件的测试台。能够满足这些要求的最佳系统是仿真。

  为AI芯片运行功率分析需要适当的工具,能够获取和处理数百GB、包含数十亿或数万亿的时钟周期。仿真系统中的功率分析有助于解决这个问题,因为它可以仅识别功率分析的感兴趣窗口。

  “AI芯片引入了两个新概念,”Maben说。“第一个是验证调试具有挑战性,因为它需要很长时间。第二个是如何开发应用软件,以便在芯片启动时可以准备就绪。这就是仿真和原型设计概念出现的地方。”

  得益于其独特的快速仿真架构、最先进的商业FPGA和基于FPGA的仿真软件创新,Synopsys的ZeBu服务器是业界最快的仿真系统,提供了传统仿真解决方案2倍的性能。ZeBu软件为用户提供了有价值的工具,如快速编译器、先进的调试(包括与Verdi的本地集成)、仿真加速、混合仿真和功率分析。

  当应用程序在仿真器上运行时,它最终会被转换为SoC的向量。这些向量可以用来运行仿真,从而验证芯片在仿真器中的功能。仿真是获取工作负载的正确平台,因为它生成了用于功率分析优化的目标向量。如图3所示,ZeBu EmPower向量由PrimePower RTL使用,为设计师提供有用的信息。

低功耗芯片

图3

  AI芯片使用了许多数学函数,主要是乘法和矩阵操作,这些操作由专用和优化的组合逻辑执行。

  “当我们进入这些计算密集型应用时,设计师担心的新概念是低几何尺寸下的毛刺功率,”Maben说。“毛刺功率占总功率的25%以上,并且我们知道毛刺功率意味着功率浪费。”

  毛刺的数量与SoC执行的操作数量成正比,使毛刺成为需要解决的AI加速器的重要问题。毛刺有两种类型:惯性毛刺和传输毛刺。惯性毛刺可以通过架构解决,而传输毛刺是由于逻辑单元的延迟,导致逻辑门输入的到达时间不同。毛刺正成为一个非常大的话题,因为它们非常难以优化和测量。

低功耗芯片

图4

  Synopsys提供了端到端的RTL到门级毛刺功率分析和优化解决方案。在RTL阶段,PrimePower RTL(见图4)可以计算并报告每层次的毛刺,并且可以指向生成最高毛刺水平的RTL源代码行。PrimePower解决方案还提供了使用RTL仿真的延迟/毛刺感知向量生成,并且可以使用零延迟门级仿真或定时感知仿真执行毛刺功率分析,与SPICE功率数值紧密相关。

浮思特科技专注功率器件领域,为客户提供IGBTIPM模块等功率器件以及MCU和触控芯片,是一家拥有核心技术的电子元器件供应商和解决方案商。