四面出击Xilinx加速FPGA在“超七大”数据中心中的主流应用

客户, 合作伙伴, 标准,产品及工具! 2014 - 2016,两年多的时间, 赛灵思从上述四大方面步步为营, 为 FPGA 在超大规模数据中心的应用做出了历史性的贡献, 尤其是今年全球超算大会SC 2106 上推出的可重配置的加速堆栈,为其在数据中心、机器学习等领域取代 GPU、CPU 甚至同类FPGA 提供了加速引擎。

回溯到2014年之前,在数据中心的领域,赛灵思都是一个陌生的名字, 短短不到三年的时间,赛灵思就已经在这个领域实现了无数里程碑式的突破,市场也获得了迅速的发展,同时也成为众多技术龙头联手的重要合作伙伴。

从客户而言 — 全球七大超大规模云服务公司,已有3家采用了赛灵思FPGA,其中的百度于今年10月宣布,其已设计出赛灵思UltraScale™ FPGA池,以加速机器学习推断。

合作伙伴关系 — 高通公司和IBM宣布与赛灵思就数据中心加速开展战略合作。与IBM的通力合作已构建了存储网络加速框架CAPI SNAP,能帮助开发人员采用赛灵思FPGA更方便地加速 NoSQL等应用。

标准上的领导地位 — 赛灵思一直引领着智能缓存一致性互联标准CCIX开发的行业计划。2016 年5月赛灵思、AMD、ARM、华为、IBM、Mellanox和高通联手结为CCIX联盟,5个月来该计划的成员数量已是成立之初的3倍。

面向数据中心的软件定义工具和产品 — 针对 FPGA 加速的SDAccel 软件定义开发环境于 2014年发布。2016年11月,赛灵思发布采用高带宽存储器和 CCIX 技术的最新16nm Virtex® UltraScale™+ FPGA产品细节。

让我们回顾一下最近两年赛灵思在推动数据中心应用而发布的相关新闻:

2014-2015年

- 2014年11月18日,Xilinx 宣布推出针对 OpenCL、 C和 C++的 SDAccel开发环境,将数据中心的单位功耗性能提高达25倍。

SDAccel是赛灵思SDx™系列的最新成员,将业界首款支持OpenCL、C和 C++内核任意组合的架构优化编译器、库、开发板完美结合在一起,在FPGA 上首次实现了完全类似CPU/GPU的开发和运行时间体验。

- 2015年1月16日,Xilinx面向OpenCL、C和C++的SDAccel开发环境顺利通过Khronos一致性测试。

赛灵思宣布,其面向OpenCL™、C和C++的SDAccel™开发环境顺利通过Khronos OpenCL 1.0标准一致性测试。OpenCL标准为软件开发人员提供了一个统一的编程环境,使其能够编写高效且可移植的代码,从而能够在赛灵思FPGA上轻松加速一系列各种算法的运行。

- 2015 年 11 月 19 日,Xilinx与IBM宣布战略合作,携手加速数据中心应用。

IBM和赛灵思联合宣布开展一项多年战略协作,在IBM POWER系统上运用赛灵思FPGA加速工作负载处理技术,以打造更高性能、更高能效的数据中心应用。双方团队联手开发开放式加速基础架构、软件和中间件,以满足机器学习、网络功能虚拟化(NFV)、基因分析、高性能计算(HPC)和大数据分析等新兴应用的需求。

- 2015年10月8日,高通和赛灵思联手提供拥有更高效率和性能的异构计算解决方案,满足下一代云计算架构演进的技术需求。

双方宣布进行战略技术合作,将在Qualcomm Technologies服务器平台上,通过基于 FPGA的动态工作负载加速,提供具备全新效率与性能水平的、业界领先的异构计算解决方案。此次战略合作覆盖从板卡级到高度集成解决方案的多代产品。目标应用包括计算加速、大数据分析、机器学习、存储和CloudRAN。

2016年-至今

- 2016年2月15日,Xilinx发布数据中心生态系统投资计划。

新计划专门针对新兴工作负载应用解决方案,如机器学习、图像及视频处理、数据分析、存储数据库加速以及网络加速等,致力于进一步壮大云计算及NFV加速解决方案。计划由“Xilinx 技术投资 (Xilinx Technology Ventures)”全权执行。

- 2016年4月8日,Xilinx携手IBM,通过SuperVessel OpenPOWER 开发云平台实现 FPGA 加速。

内置在 SuperVessel中的赛灵思 SDAccel™开发环境,支持用C、C++和OpenCL实现FPGA加速,将为包括大数据分析和机器学习等性能要求严苛应用的开发提供支持。

- 2016年 5月25日,Xilinx宣布七大技术龙头联手,合力为数据中心及其它市场推出开放式加速架构。

AMD、ARM、华为、IBM、Mellanox、高通和赛灵思公司在最新加速器缓存一致性互联 (CCIX)规范上互相联手,支持多处理器架构和加速器无缝共享数据。

- 2016年5月27日, Xilinx宣布扩大16nm UltraScale+产品路线图,为数据中心新增加速强化技术。

结合16nm UltraScale+可编程逻辑与高带宽显存(HBM)存储器和新型加速器互联技术,满足异构计算要求,支持新近宣布推出的加速缓存一致性互联(CCIX)技术。

- 2016年10月18日, Xilinx宣布CCIX联盟成员增长 3倍并推出相关规范。

CCIX联盟成员数量已经迅速增至原来的三倍,且发布了联盟成员相关规范。作为CCIX 联盟创始成员,AMD、ARM、华为、IBM、迈络思(Mellanox)、高通和赛灵思对新成员的加入表示了热烈的欢迎。通过密切的协作,成员公司已经达成一致的CCIX规范标准,通过运用当今现有的生态系统,并加以改进,使其支持更高带宽、更低时延和全面的一致性,从而满足数据中心的互联需求。

- 2016年10月20日,Xilinx宣布百度数据中心采用Xilinx FPGA加速机器学习应用。

中文互联网搜索引擎提供商百度正在采用赛灵思FPGA加速其中国数据中心的机器学习应用。赛灵思FPGA提供的功耗效率让加速器能部署于整个数据中心,而且可将单位功耗性能比提升10-20倍。百度优化的FPGA平台是专门针对图像和语言识别等机器学习应用而精心打造。此外,百度还计划采用这些平台来开发商业可行的自动驾驶汽车。

- 2016年11月14日,Xilinx发布采用高带宽存储器和CCIX技术的新型 16nm Virtex UltraScale+ FPGA细节,四款新器件革命性地将存储器带宽提升了20倍,可以充分满足计算密集型应用的需求。

采用HBM和CCIX技术的新型16nm Virtex® UltraScale+™ FPGA,拥有最高存储器带宽,相比DDR4 DIMM将存储器带宽提升了20倍,而相比竞争性存储器技术,则将单位比特功耗降低4倍。这些新型器件专为满足诸如机器学习、以太网互联、8K视频和雷达等计算密集型应用所需的更高存储器带宽而打造,同时还提供CCIX IP,支持任何 CCIX处理器的缓存一致性加速,满足计算加速应用要求。

- 2016年11月14日,领先的HPC (高性能计算)云平台提供商Nimbix宣布与Xilinx 联手扩展FPGA 负载加速在云端的应用。

Nimbix 宣布在其Nimbix云平台上已经提供赛灵思SDAccel™ 开发环境,可以提供按需 开发、测试和部署基于 FPGA的加速工作负载。

- 2016年11月15日, Xilinx可重配置加速堆栈提供业界最高计算效率,比CPU快40倍,其它 FPGA快2-6倍

赛灵思推出可重配置加速堆栈方案,可以帮助全球最大的云端服务供应商们快速开发和部署加速平台。专门针对云级应用而设计的基于FPGA的赛灵思可重配置加速堆栈,包括库、框架集成、开发板并支持OpenStack。通过赛灵思FPGA,该可重配置加速堆栈方案提供了业界最高的计算效率:比x86服务器CPU高出40倍;比竞争型FPGA方案高出6倍。


cache
Processed in 0.007273 Second.