当前位置: 首页 >> 基本常识
人气推荐
日期归档
Mellanox 200G HDR深度学习加速引擎结合 NVIDIA 将人工智能平台应用加速两倍
  
  来源: www.zztaida.com.cn 点击:1545

梅兰诺网络计算“分层聚合与约简协议”(SHARP)技术结合英伟达聚合通信函数库(NCCL)为人工智能

梅兰诺技术带来性能突破,2019年3月19日。纳斯达克股票代码:MLNX)是数据中心服务器和存储系统的高性能端到端互连解决方案的领先提供商。该公司今天宣布,使用“可扩展分层聚合和缩减协议”(SHARP)技术,与HDR 200G InfiniBand一起创造了新的性能记录,将深度学习操作的性能提高了一倍。Mellanox网络计算SHARP技术、NVIDIA V100张量核心GPU技术和融合通信函数库(NCCL)的结合,为深度学习和人工智能应用带来了领先的效率和可扩展性。

结合最先进的NVIDIA GPU、Mellanox的InfiniBand网络、GPUDirect RDMA技术和NCCL通信库来训练神经网络,已成为扩展深度学习框架(如Caffe、Caffe2、Chainer、MXNet、TensorFlow和PyTorch)的事实标准。借助Mellanox SHARP技术和HDR InfiniBand网络,用于深度学习培训的数据聚合操作可以卸载并加速至双倍性能。

通过与英伟达的合作以及梅兰诺性能实验室的测试和验证,使用梅兰诺HDR无限带宽量子交换机连接了四个系统主机。每台主机使用八个英伟达V100张量核心图形处理器和一个使用英伟达互联技术的ConnectX-6 HDR网卡。通过将夏普(SHARP)的本地流聚合功能与NVIDIA最新的NCCL 2.4通信库(现在可以充分利用Mellanox网络提供的双向带宽)相结合,实现了19.6千兆/秒的有效缩减带宽。在相同的硬件配置下,SHARP实现的带宽性能是NVIDIA当前基于树型通信结构的实现的两倍。

在更常见的系统配置中,如果每个主机系统中有4个HCA卡用于各种作业的负载平衡,夏普和NCCL的初始计算将产生70.3GB/s的流量。对于更高密度的图形处理器系统,如NVIDIA DGX-2,每个系统节点有16个使用NVLink技术的NVIDIA V100张量核心图形处理器,Mellanox的网络计算功能和全双向带宽将得到充分利用。

Mellanox Technologies营销副总裁吉拉德沙伊纳(Gilad Shainer)表示:“我们与英伟达的长期合作为我们带来了强大的解决方案,充分利用了Mellanox InfiniBand网络的卓越性能,包括整合到NCCL的GPUDirect RDMA技术和网络计算技术,为人工智能应用提供了两倍于过去的性能。HDR InfiniBand网络计算加速引擎(包括夏普技术)为高性能计算和人工智能工作负载提供了出色的性能和可扩展性。”英伟达副总裁兼加速计算总经理伊恩巴克(Ian Buck)表示:“梅兰诺(Mellanox)解决方案与我们开源融合通信函数库NCCL的整合极大地提升了英伟达无与伦比的CUDA-X加速库的性能。我们共同努力,提供完整的解决方案,以确保数据中心中要求最苛刻的人工智能应用从尖端性能和扩展效率中获益。”

辅助资源:

●了解Mellanox SHARP的更多信息

了解Melanox Quantum HDR 200 GB/s Infiniband智能开关的更多信息

在推特、脸书、谷歌、领英和YouTube上观看Melanox。

●加入Melanox社区

Mellanox

Mellanox公司英文全称是Mellanox Technologies(中文名称:Mailanox),它是为全球服务器和存储提供端到端InfiniBand和以太网连接解决方案的领导者。Mellanox互连解决方案通过低延迟和高吞吐量的强大性能,可以大大提高数据中心的效率,在应用程序和系统之间快速传输数据,并提高系统可用性。Mellanox为行业提供技术和产品来加速内部设备的互联,包括网卡、交换机、软件和芯片,这可以加速应用程序的执行,最大限度地提高高性能计算、企业数据中心、Web2.0、云计算、存储和金融服务的效率。请注意更多信息:www.mellanox.com。

友情链接:
普宁门户网 版权所有© www.zztaida.com.cn 技术支持:普宁门户网 | 网站地图