加速市场成新蓝海 谁将扮演主力?| 智慧产品圈

原创 李映 2018-04-25
标签 IC

  伴随着数据的指数级增长,以及AI尤其是深度学习算法的爆发式增长,数据中心服务器承载的压力越来越大,以传统通用x86服务器为核心的计算平台明显力不从心,加速刻不容缓。而AI计算平台的需求也在从云端向管端、边缘端延伸,不断涌现的新型模型算法、训练学习方法和应用将影响AI基础架构的发展路线。在这一趋势下,杀入战局的GPU、FPGA或ASIC谁将胜出?

  FPGA加速成新蓝海

  庞大的数据分析推动了加速需求上扬,预计未来三分之一的服务器都将提供加速功能。而除CPU外,通用加速器FPGA和专用加速器ASIC均有用武之地。

  “FPGA加速在数据中心应用处在‘蓝海’阶段,其应用还可拓展至AI、视频转码、网络安全、金融加速、基因研究等。” 英特尔可编程解决方案事业部亚太区市场拓展经理刘斌十分看好FPGA。



  杭州加速云信息技术有限公司CEO他认为邬刚从“本质”剖析,在云端,GPU完成AI推理的问题在于功耗高、延时长等,而基于门级电路设计使得FPGA是一个超低延时和确定延时的方案,并且其可编程性及动态可重构可适应未来算法的变化,I/O可编程性亦可满足更多业务需求(网络加速、边缘计算),基于FPGA的深度学习推理将成未来发展方向。

  至于管侧和边缘侧,“关键要看场景,有些适合FPGA,有些适合GPU,须综合考量计算性能、能耗、吞吐和延迟等方面的需求。” 邬刚表示,“边缘侧讲究功耗,这显然是ASIC的生意。在管侧的网关来说,则非常适合FPGA,GPU虽然也在攻占这一市场,但仍面临接口、实时性、低延迟等问题。”

  “任何一个芯片都有自己的特定应用场景,不能包打天下,只能找到准确的适合场景,有优势的定位才可胜出。” 邬刚总结。

  服务器加速正在“进行时”

  虽然GPU有英伟达的加持而备受瞩目,但FPGA 的厚势依然十足。据去年10月,英特尔发布了搭载Arria 10GX FPGA芯片的可编程加速卡之外,英特尔近日也宣称其推出了面向至强CPU和FPGA的加速堆栈,打造全新FPGA加速器功能生态系统。

  要知道,以往FPGA开发的难点在于开发周期长,生态不佳。刘斌指出,此次推出这一跨行业通用的软件堆栈,将解决这一难题,其通用开发接口支持代码复用,并提供包括OPAE(开放可编程加速引擎)、加速库、SDK等工具,开启FPGA加速可在常见软件开发环境中提供通用硬件加速性能,开发者将更易于部署和优化工作负载。



  刘斌还称,OPAE是开源的,目的是为了营造更强大的生态,目前加速软件堆栈是免费的,客户可从网上下载,未来英特尔也将考虑提供深度学习推理的加速器等。与之相呼应的是,戴尔和富士通这两大OEM厂商已宣布采用英特尔FPGA加速器的数据中心服务器已上市。

  在数据分析市场一些厂商的先行试水,显现出FPGA的巨大潜力。刘斌介绍,风险分析市场将2022年将达359亿美元,但其面临着数据量大、模型不断变化、纯软件实现受限等几大挑战,而在Levyx所给出的案例中,相比传统spark实施,借助英特尔 PAC 和加速堆栈,算法执行速度和期权计算速度分别提高了八倍和两倍。在2022年市场将达38.5亿美元的数据库加速层面,Swarm64公司在采用了英特尔FPGA加速平台后,其实时数据分析的速度平均提高了20倍。

  IP库构建FPGA新生态

  虽然FPGA有其先天优势,但FPGA仍有自己的“难处”。邬刚坦言,FPGA的开发难度以及生态还待改进,英伟达的GPU大行其道,因而其开发了CODN库,第三方合作伙伴基于此构建了生态。针对此,加速云在推出了基于FPGA的AI加速平台方案SC-OPS、SC-VPX之外,还推出了两大IP库深度学习加速库FDNN和高性能计算加速库FBLAS,以及深度学习方案、高性能计算方案、边缘计算智能工控三大方案。

  在IP库方面,FDNN是国内首个支持通用卷积神经网络的FPGA加速库,基于RTL级代码,可提供很高的性能和灵活配置性。FBLAS是业界更高性能的RTL级数学加速库。SC-OPS是基于英特尔14nm工艺的Stratix10 GX2800 FPGA加速卡,主打深度学习;SC-VPX是全球计算密度最高的VPX刀片加速平台,采用英特尔 Stratix 10 GX2800器件,主攻高性能计算。



  因而,加速云的AI加速平台并不是简单的板卡,而是提供从硬件到IP再到常用I/O、协议的全套方案。邬刚还指出,基于对FPGA 的深度了解和技术,加速云获得英特尔等的全力支持,甚至可以拿到英特尔第一批流片的内部测试芯片,而且价格非常合适。目前加速云硬件方案已迭代了4代。

  邬刚表示,光有一个硬件,FPGA就像一张白纸,有了IP,画图才能真正实现。客户在做开发时,一是可直接用FPGA板卡,二是可采用IP,三是定制化选择,十分灵活。

  至于为何不是原厂提供IP,邬刚解释说,原厂不可能深入所有行业,一定是在某些行业寻找第三方合作伙伴,利用它的硬件平台和堆栈,开发和提供相关应用所需的IP。英特尔的加速堆栈是基于FPGA的OpenCL的开发环境,而加速云的IP库在Verilog基础之上,双方合力构建了更好的生态体系。

  -----------------------------------

  • 中兴事件敲响警钟,中国设备制造企业如何回避风险?

  • 在市场耕耘多年的“中国芯”如何在物联网时代弯道超车?

  • 经年“中国制造”带来哪些中国原创嵌入式算法优势积累?

  • 如何打造中国人自己的“IP-嵌入式系统-MCU-算法-传感器-通讯-云平台/大数据”技术生态?

  2018年5月18日

  智慧家庭:物联网嵌入式技术生态高峰论坛

  解读中国芯的物联网生态崛起!

扫码即刻报名:



议程如下:



  也可点击“智慧家庭:物联网嵌入式技术生态高峰论坛”进入报名通道。

  

* 如无特殊说明,网站所有文章版权归智慧产品圈所有,转载请注明来源


收藏
赞(1)
文章评论

李映

联系我 +

微信:

推荐专题
杂志订阅
weixin二维码

微信 扫一扫
获取第一手资讯