手机版
你好,游客 登录 注册
背景:
阅读新闻

Mozilla发布DeepSpeech 0.6,更好的性能更出色的语音转文本引擎

[日期:2019-12-09] 来源:Linux公社  作者:醉落红尘 [字体: ]

Mozilla继续开发的辅助项目之一是DeepSpeech,这是一种由百度研究得出的语音转文本引擎,并在TensorFlow之上构建,具有CPU和NVIDIA CUDA加速功能。本周标志着Mozilla DeepSpeech 0.6的发布,该版本进行了性能优化,Windows构建,简化了语言模型以及其他更改。

DeepSpeech 0.6目前已为该开源语音转文本引擎实现了7.5%的单词错误率。新版本进行了各种API更改,通过TensorFlow 1.14 cuDNN RNN支持为其训练图提供了更好的训练性能,将语言模型缩减为使用前50万个单词,并添加了各种数据增强技术,一种用于大容量转录大型音频文件的工具,以及其他各种变化。

那些想尝试DeepSpeech 0.6从音频文件转录语音的人可以从GitHub获取二进制版本。 Mozilla Hacks博客上还有关于DeepSpeech 0.6改进的更多详细信息。

Linux公社的RSS地址https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址https://www.linuxidc.com/Linux/2019-12/161685.htm

linux
相关资讯       DeepSpeech  DeepSpeech 0.6 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款