2013年8月1日,发布了OpenBLAS 0.2.8版本。
各位用户抱歉,在0.2.7版本没有对AMD平台进行充分的测试,所以0.2.7版本Bulldozer和Piledriver架构的优化kernel存在计算结果错误。此次0.2.8版本,对这两个架构的kernel进行了回滚,使用了Barcelona的旧kernel,保证结果正确,但是性能一般。预期Bulldozer和Piledriver架构的优化kernel,在修复错误后,会包含在0.2.9版本中。
具体请参考发布页 https://github.com/xianyi/OpenBLAS/releases/tag/v0.2.8
主要更新如下
- 回滚AMD Bulldozer和Piledriver架构的代码为旧的Barcelona代码
- 支持Open64编译器5.0版本,make CC=opencc FC=openf95
- 对汇编代码增加GNU executable stack标记
- 可接受用户输入的LDFLAGS
OpenBLAS 的详细介绍:请点这里
OpenBLAS 的下载地址:请点这里
