手机版
你好,游客 登录 注册 搜索
背景:
阅读新闻

OpenBLAS 0.3.8 发布,带来更多AVX2 / AVX512内核

[日期:2020-02-11] 来源:Linux公社  作者:醉落红尘 [字体: ]

对于那些使用OpenBLAS作为您的BLAS(基本线性代数子程序)实现的人,本周末发布了OpenBLAS 0.3.8,随之而来的是更多的AVX2/AVX-512内核和其他优化。

OpenBLAS继续努力与Intel的MKL和其他优化的BLAS实施竞争,而更多的AVX2和AVX-512应该有助于提高最新的Intel和AMD CPU的性能。现在有一个AVX-512 DGEMM内核,“显著”改进了AVX-512 SGEMM内核,以及针对CGEMM和ZGEMM的经过优化的新AVX-512内核。在AVX2方面,据说STRMM,SGEMM和CGEMM的内核以及CGEMM3M和ZGEMM3M的新内核已大大加快了速度。

OpenBLAS 0.3.8还增加了对QEMU虚拟CPU检测,Intel Goldmont Plus CPU自动检测,ARMv8性能优化,各种POWER优化,LAPACK 3.9.0的集成,CMake构建系统改进以及其他常规优化的支持。还提供GCC 10编译器支持,并使用g95和LD链接器的非GNU版本改进了编译。完善的发行版是NetBSD的官方支持。

通过GitHub了解OpenBLAS 0.3.8版本的更多详细信息。

Linux公社的RSS地址https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址https://www.linuxidc.com/Linux/2020-02/162277.htm

linux
相关资讯       OpenBLAS 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款