Achronix宣布即日推出用于人工智能/机器学习和网络硬件加速应用的第四代Speedcore eFPGA IP

2018-12-05 07:27:00 来源:EEFOCUS
标签:
与之前一代的Speedcore 嵌入式FPGA(eFPGA)产品相比,Speedcore Gen4的性能提速60%、功耗降低50%、芯片面积缩小65%
 
新的机器学习处理器(MLP)单元模块为人工智能/机器学习(AI / ML)应用提供高出300%的性能
 
美国加利福尼亚州圣克拉拉市,2018年12月4日 -基于现场可编程门阵列(FPGA)的硬件加速器器件和高性能嵌入式FPGA半导体知识产权(eFPGA IP)领导性企业Achronix半导体公司今天宣布:即日起推出其第四代嵌入式FPGA产品Speedcore™Gen4 eFPGA IP,以支持客户将FPGA功能集成到他们的SoC之中。Speedcore Gen4将性能提高了60%、功耗降低了50%、芯片面积减少65%,同时保留了原有的Speedcore eFPGA IP的功能,即可将可编程硬件加速功能引入广泛的计算、网络和存储应用,实现接口协议桥接/转换、算法加速和数据包处理。
 
在Speedcore Gen4架构中,Achronix将机器学习处理器(MLP)添加到Speedcore可提供的资源逻辑库单元模块中。MLP模块是一种高度灵活的计算引擎,它与存储器紧密耦合,从而为人工智能和机器学习(AI / ML)应用提供了性能/功耗比最高和成本最低的解决方案。
 
Achronix 半导体公司总裁兼首席执行官Robert Blake说道:“Achronix是第一家向SoC开发公司提供量产eFPGA IP的公司,使他们能够创建支持各种全新应用的可编程数据加速器。新的Speedcore Gen4 eFPGA架构提供了以前仅在ASIC中才能实现的、最佳的硬件加速平衡,以及我们经过量产验证过的FPGA技术提供的灵活性和可编程性,从而为新兴人工智能/机器学习和高数据带宽应用的爆炸式需求提供了支持。”
 
Robert补充到:“我们正在使用经过验证的同样的方法体系来为客户提供最新的Speedcore Gen4 eFPGA技术,来满足他们将eFPGA IP的所有优势和灵活性与增强的人工智能/机器学习功能相结合的愿望,而这种最前沿的人工智能/机器学习功能得益于我们最新机器学习处理器单元模块和台积电(TSMC)最先进的7nm工艺技术。”
 
解决带宽爆炸问题
固定和无线网络带宽的急剧增加,加上处理能力向边缘等进行重新分配,以及数十亿物联网设备的出现,将给传统网络和计算基础设施带来压力。这种新的处理范式意味着每秒将有数十亿到数万亿次的运算。传统云和企业数据中心计算资源和通信基础设施无法跟上数据速率的指数级增长、快速变化的安全协议、以及许多新的网络和连接要求。传统的多核CPU和SoC无法在没有辅助的情况下独立满足这些要求,因而它们需要硬件加速器,通常是可重新编程的硬件加速器,用来预处理和卸载计算,以便提高系统的整体计算性能。经过优化后的Speedcore Gen4 eFPGA已经可以满足这些应用需求。
 
Speedcore Gen4是最佳的人工智能/机器学习加速器
除了计算和网络基础设施的通用要求之外,人工智能/机器学习还对高密度和针对性计算产生了显著增加的需求。与以前的Achronix FPGA产品相比,新的Achronix机器学习处理器(MLP)利用了人工智能/机器学习处理的特定属性,并将这些应用的性能提高了300%。这是通过多种架构性创新来实现的,这些创新可以同时提高每个时钟周期的性能和操作次数。
 
新的Achronix机器学习处理器(MLP)是一个完整的人工智能/机器学习计算引擎,支持定点和多个浮点数格式和精度。每个机器学习处理器包括一个循环寄存器文件(Cyclical Register File),它用来存储重用的权重或数据。各个机器学习处理器与相邻的机器学习处理器单元模块和更大的存储单元模块紧密耦合,以提供最高的处理性能、每秒最高的操作次数和最低的功率分集。这些机器学习处理器支持各种定点和浮点格式,包括Bfloat16、16位、半精度、24位和单元块浮点。用户可以通过为其应用选择最佳精度来实现精度和性能的均衡。
 
为了补充机器学习处理器并提高人工智能/机器学习的计算密度,Speedcore Gen4查找表(LUT)可以实现比任何独立FPGA芯片产品高出两倍的乘法器。领先的独立FPGA芯片在21个查找表可以中实现6x6乘法器,而Speedcore Gen4仅需在11个LUT中就可实现相同的功能,并可在1 GHz的速率上工作。
 
架构性创新提高系统性能
与上一代Speedcore产品相比,新的Speedcore Gen4架构实现了多项创新,从而可将系统整体性能提高60%。其中查找表的所有方面都得到了增强,以支持使用最少的资源来实现各种功能,从而可缩减面积和功耗并提高性能。其中的更改包括将ALU的大小加倍、将每个LUT的寄存器数量加倍、支持7位函数和一些8位函数、以及为移位寄存器提供的专用高速连接。
 
其中的路由架构也借由一种独立的专用总线路由结构得到了增强。此外,在该路由结构中还有专用的总线多路复用器,可有效地创建分布式的、运行时可配置的交换网络。这为高带宽和低延迟应用提供了最佳的解决方案,并在业界首次实现了将网络优化应用于FPGA互连。
 
如何评估Speedcore Gen4
Achronix的ACE设计工具中包括了Speedcore Gen4 eFPGAs的预先配置示例实例,它们可支持客户针对性能、资源使用率和编译时间去评估Speedcore Gen4的结果质量;Achronix现已可提供支持Speedcore Gen4的ACE设计工具。Speedcore采用了一种模块化的架构,它可根据客户的要求轻松配置其大小。Achronix使用其Speedcore Builder工具来即刻创建新的Speedcore实例,以便满足客户对其快速评估的要求。对于需要了解芯片尺寸和功率信息的客户,可以联系Achronix来了解有关其特定Speedcore Gen4 eFPGA的面积和工艺要求的详细信息。
 
供货
对于已量产的Speedcore架构,Achronix可在6周内为客户配置并提供Speedcore eFPGA IP和支持文件。采用台积电7nm工艺节点的Speedcore Gen4将于2019年上半年投入量产,但是芯片设计企业现已可以联系Achronix,以获得支持其特定需求的Speedcore Gen4实例。Achronix还将于2019年下半年提供用于台积电16nm和12nm工艺节点的Speedcore Gen4 eFPGA IP。
 
关注电子技术交流网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
安富利将收购Softweb Solutions 在其生态系统中加入软件和人工智能,并有效提升物联网能力

全球领先的技术方案提供商安富利今日宣布将收购Softweb Solutions公司。Softweb Solutions是一家私营的软件及人工智能(AI)企业,为旨在提高效率、加快产品上市并助力企业转型的物联网(IoT)应用和系统,提供创新的软件解决方案。

深兰科技携手美团,将自动驾驶技术运用到外卖配送

专家预测,随着电商的推动,资本的介入,大数据技术的支持以及智能物流行业的需求不断被激发,预计到2022年中国智能物流行业市场规模将增长至7938亿元人民币。

有核心技术才能熬过“寒冬”,半导体初创企业也如此

2018年进入到下半年之后,一个词汇让各行各业都诚惶诚恐,那就是凛冬将至。从手机和汽车市场负增长,很多人已经感受到了科技的寒冬可能已经来了。

人工智能推广应用会怎么走?是否靠算法的不断提升?

人脸识别、语音识别是人工智能应用最为人熟知的两个领域。智能音箱、人脸门禁也已经走进不少人的生活。去年大火的无人货柜,则用到了“物品识别”技术。接下来,人工智能推广应用会怎么走?靠算法的不断提升吗?

全球十大AI领袖人物公布,中国只有一人上榜
全球十大AI领袖人物公布,中国只有一人上榜

昨天午饭期间,我和老美同事尬聊,他突然跟我说:Han,“全球十大AI领袖人物”刚刚公布了。这是由《哈佛商业评论》评选的年度榜单。

更多资讯
2018半导体行业并购案大盘点:态势回落,此起彼伏
2018半导体行业并购案大盘点:态势回落,此起彼伏

近年来,全球半导体行业并购案可以说是停不下来,为抢占市场、扩大影响力,半导体行业发生大小并购案可谓是此起彼伏。

英特尔从AMD疯狂挖人,慌了?
英特尔从AMD疯狂挖人,慌了?

目前,包括AMD图形部门首席架构师以及处理器内核首席架构师在内等多位核心高管均已加入英特尔。尤其是图形部门,从技术负责人到市场、营销负责人,均被英特尔收入麾下,成了英特尔新组建的核心/视觉计算组的核心高管。

处于“寒冬期”的手机市场能否被AI芯片带活?
处于“寒冬期”的手机市场能否被AI芯片带活?

2018年人工智能的热潮深刻影响各个产业领域,而AI芯片作为人工智能的核心,已经成为风口浪尖的投资产品,不同行业的巨头推出各种各样的AI芯片。

厉害了复旦大学,首次观测到三维量子霍尔效应
厉害了复旦大学,首次观测到三维量子霍尔效应

复旦大学物理学系修发贤课题组在拓扑半金属砷化镉纳米片中观测到了由外尔轨道形成的新型三维量子霍尔效应的直接证据,迈出了从二维到三维的关键一步。

高通推出下一代物联网专用蜂窝技术芯片组,有啥看点?
高通推出下一代物联网专用蜂窝技术芯片组,有啥看点?

北京时间12月18日上午消息,高通公司推出了9205 LTE调制解调器,这是一款专为对低功耗和广域网(LPWAN)有特殊要求的物联网应用设计的芯片组。

电路方案