所在位置:首页 > 今日话题 >
Radeon Instinct发布,推动下一代真正异构计算
[导读]早在2016年12月,我们首先宣布了Radeon Instinct计划,将我们计算研发能力与我们在开源软件方面的努力相结合。 今天,我们很高兴地告诉您有关直觉式计算愿景的新篇章。AMD近期将向合作...
早在2016年12月,我们首先宣布了Radeon Instinct计划,将我们计算研发能力与我们在开源软件方面的努力相结合。
今天,我们很高兴地告诉您有关直觉式计算愿景的新篇章。AMD近期将向合作伙伴出货Radeon Instinct加速卡,这些合作伙伴包括Boxx,Colfax,Exxact Corporation、Gigabyte、Inventec和Supermicro等厂商,并从2017年第三季度开始驱动这些厂商的深度学习和HPC解决方案。
人工智能和机器学习正在以几年前我们无法想象的方式改变世界,实现改变生活的突破,能够解决以前无法解决的问题。Radeon Instinct MI25、MI8和MI6结合AMD开放式ROCm 1.6软件平台,将大大提高性能,效率并且易于实施,从而加速深度学习推理,加速训练机器智能。我们不只是希望加速机器智能发展,而且要为下一代真正的异构计算提供动力。
Exxact公司业务发展总监Nicholas Chen表示:“AMD全新Radeon Instinct加速器,加上开放源码,以及支持可扩展的ROCm深度学习MIOpen框架,可以帮助加快下一代机器学习方面发明和创新浪潮,使我们能够提供专门设计的AI超级计算机,提供突破性能和结果。我们预计采用下一代”Vega“架构的Radeon Instinct MI25,结合我们的简化管理工具,将为深度学习推理和训练提供强大解决方案,为要求最苛刻的机器智能和HPC工作负载提供所需性能,效率和TCO。”
全新Radeon Instinct加速卡
通过我们的Radeon Instinct服务器加速卡产品和开放的生态系统,我们能够为客户提供具有成本效益的机器和深度学习训练,边缘训练和推理解决方案,其中工作负载可以最大限度地利用GPU高度并行的计算能力。
Supermicro软件解决方案和基础架构副总裁Michael McNerney表示:“在过去一年里,我们与AMD在Radeon Instinct图形处理器方案中合作,我们将在型号为YS-4028GR-TR(T)/-TR(TT2)的4U SuperServer服务器当中初步支持多达八张Radeon Instinct MI25加速卡,为客户提供机器智能和高性能计算。我们期待为客户提供基于AMD Radeon Instinct产品的系统,利用其下一代”Vega“GPU架构以及开放式生态系统加速HPC深度学习。”
我们推出了首批三款Radeon Instinct加速卡,以解决广泛的机器智能应用,其中包括学术、政府实验室、能源、生命科学、金融、汽车和其他行业当中以数据为中心的HPC级系统:
· Radeon Instinct MI25 加速卡,基于“Vega” GPU 架构,采用 14nm FinFET 工艺,将成为世界上大型机器智能和深度学习数据中心应用的终极训练加速卡。MI25内建64个计算单元(4096个流处理器),在被动式冷却的单GPU服务器卡中提供优异的FP16和FP32性能,具有24.6 TFLOPS的FP16或12.3 TFLOPS的FP32峰值性能。凭借16GB超高带宽HBM2 ECC GPU内存和高达484 GB/s内存带宽,Radeon Instinct MI25针对大规模并行应用进行优化,满足大型数据集机器智能和HPC级系统工作负载需求。
· Radeon Instinct MI8加速卡,利用“Fiji”GPU架构的高性能,高能效,是一种小尺寸HPC和推理加速卡,具有8.2 TFLOPS峰值FP16 | FP32性能,板载功耗小于175W,内建4GB高带宽内存(HBM)和512-bit内存界面。MI8非常适合机器学习推理和HPC应用。
· Radeon Instinct MI6加速卡,基于广受赞誉的“Polaris”GPU架构,是一种被动冷却的推理加速卡,其峰值FP16|FP32性能为5.7 TFLOPS,峰值板载功耗为150瓦,内建16GB超快速GDDR5 GPU内存,256-bit内存界面。MI6是一种多功能加速卡,适用于HPC和机器学习推理以及边缘训练部署。
Radeon Instinct硬件由我们的开源软件平台推动,其中包括:
· 可扩展的全开源ROCm 1.6软件平台,计划于6月29日推出,它的性能已经改进,并且支持MIOpen 1.0,为新一代混合Hyperscale和HPC级系统工作负载提供灵活,强大的异构计算解决方案。ROCm软件平台由开源Linux®驱动程序组成,为可扩展多GPU计算优化,提供多种编程模式,HIP CUDA转换工具,并使用异构计算编译器(HCC)支持GPU加速。
· 开源的MIOpen GPU加速库现在可用于ROCm平台,支持机器智能框架,并且计划支持Caffe®、TensorFlow® 和Torch®.
以基于“Zen”的Epyc™服务器和Radeon Instinct加速卡革新数据中心
Radeon Instinct MI25结合我们全新基于“Zen”的Epyc™服务器以及革命性的ROCm开放软件平台,将从底层为开放式异构计算和机器学习提供先进的方法。
技嘉技术研究与开发副总裁Daniel Hou表示:“通过开放的硬件和软件方式,AMD赋予我们客户以潜力,让他们在设计大规模系统时可以从底层进行定制。凭借Radeon Instinct MI25加速卡和AMD全新基于“Zen”的Epyc™服务器,我们现在能够为我们的客户提供无与伦比的服务器解决方案,提供令人难以置信的性能和成本效益,使其能够满足机器智能和高性能计算工作量日益增长的需求。”
我们计划在第三季度向我们的技术合作伙伴出货Radeon Instinct产品,用在它们的深度学习和HPC解决方案设计当中,让客户可以为开放式机器学习真正自由地选择解决方案供应商。