Radeon开放式计算“ROCm”堆栈的新版本现已发布,但仍未提供Navi支持。
Radeon Open Compute 3.1是新版本,现在对其默认安装目录结构进行版本控制,添加了对7nm Vega的RAS支持,还引入了SLURM支持。
可靠性,可访问性和可维护性功能适用于HBM ECC内存错误处理,GFX/MMHUB ECC错误和PCIe不可纠正错误。如果发生这些不可纠正的错误,则RAS行为是使用BACO执行GPU重置。 Vega的这项7纳米工作大概仍在显微镜下进行,这将是今年基于Vega的“ Arcturus”计算加速器的结果。
ROCm 3.1的另一个新特性是SLURM对AMD gpu的支持,这是用于资源管理的简单Linux实用程序。这个用于Linux集群的集群管理和作业调度系统现在可以与AMD GPU进行交互了。鉴于Radeon GPU和其他更大的AMD GPU部署在超级计算领域取得的成功越来越多,SLURM支持是一项有用的补充。
可以通过GitHub下载并提供ROCm 3.1的更多细节。不幸的是,仍然没有GFX10/Navi支持的迹象。
Linux公社的RSS地址:https://www.linuxidc.com/rssFeed.aspx
本文永久更新链接地址:https://www.linuxidc.com/Linux/2020-02/162463.htm
