手机版
你好,游客 登录 注册
背景:
阅读新闻

NVIDIA 宣布 CUDA 10.2 将是支持 macOS 的最后一个版本

[日期:2019-11-26] 来源:Linux公社  作者:醉落红尘 [字体: ]

NVIDIA上周宣布发布CUDA 10.2。这是macOS支持开发CUDA应用程序的最新版本,并将在下一版本中完全删除。其他更新包括libcu++,新的互操作性API等。

CUDA 10.2中的主要更新

CUDA 10.2的常规更新

  • 新的API:CUDA 10.2随CUDA虚拟内存管理API一起提供。添加了新的互操作性API,用于缓冲区分配,同步和流传输。但是,这些都是beta版,在将来的发行版中可能会更改。
  • 对新操作系统的支持:此版本增加了对一些新操作系统的支持,包括Fedora 29,红帽企业Linux(RHEL)7.x和8.x,OpenSUSE 15.x,SUSE SLES 12.4和SLES 15.x,Ubuntu 16.04.6 LTS和Ubuntu 18.04.3 LTS。在CUDA 10.2中,不建议使用RHEL 6.x,并且在下一版CUDA中将不再提供支持。
  • 增加了Maxwell + GPU的纹理大小限制:CUDA中Maxwell + GPU的1D线性纹理大小限制现在增加到2^28。

CUDA工具中的更新

  • Nvidia CUDA编译器(NVCC)现在支持将Clang 8.0和Xcode 10.2作为主机编译器。
  • 有一个新的-forward-unknown-to-host-compiler选项,该选项允许将NVCC无法识别的选项转发到主机编译器。
  • 现在,Visual Profiler和NVProf允许在台式机平台上为非root用户和非管理员用户提供跟踪功能。事件和指标分析仍然仅限于非root用户和非管理员用户。
  • 同样,从CUDA 10.2开始,Visual Profiler和NVProf使用动态/共享CUPTI库。在启动Visual Profiler和NVProf之前,要求用户设置CUPTI库的路径。

CUDA库中的更新

  • cuBLAS:cuBLAS库是标准基本线性代数子例程(BLAS)的快速GPU加速实现。在CUDA 10.2中,由于内部工作区尺寸的增加,在某些大尺寸和其他GEMM尺寸上的性能进一步提高。
  • cuSOLVER:该库包含一组直接求解器,可为计算机视觉,CFD和线性优化应用程序提供显着的加速。在此版本中,引入了新的Tensor Cores加速迭代优化求解器(TCAIRS)。 cusolverMg库包含“ cusolverMgGetrf”和“ cusolverMgGetrs”,以支持多GPU LU。
  • cuFFT:该库提供GPU加速的FFT实现,其执行速度比仅CPU的替代方案快10倍。该版本在以下用例中具有改进的性能和可伸缩性:多GPU非2转换能力,R2C和Z2D奇数转换,具有小尺寸和大批处理数量的2D转换

这些是CUDA 10.2中的一些更新。阅读官方发行说明,以了解此发行版还附带了什么。

Ubuntu 18.04 N卡驱动安装+CUDA10.0+cuDNN7.5+Anaconda+Tensorflow-GPU  https://www.linuxidc.com/Linux/2019-06/158951.htm

Linux公社的RSS地址https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址https://www.linuxidc.com/Linux/2019-11/161574.htm

 

linux
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款