1. 程式人生 > >DeepSpeech語音轉文字合成技術

DeepSpeech語音轉文字合成技術

DeepSpeech 是百度開發的開源實現庫,它提供了當前頂尖的語音轉文字合成技術。它基於 TensorFlow 和 Python,但也可以繫結到 NodeJS 或使用命令列執行。

Mozilla 一直是構建 DeepSpeech 和開源軟體庫的主要研究力量,Mozilla 技術戰略副總裁 Sean White 在一篇博文中寫道:「目前只有少數商用質量的語音識別引擎是開源的,它們大多數由大型公司主宰。這樣就減少了初創公司、研究人員和傳統企業為它們的使用者定製特定的產品與服務。但我們與機器學習社群的眾多開發者和研究者共同完善了該開源庫,因此目前 DeepSpeech 已經使用了複雜和前沿的機器學習技術建立語音到文字的引擎。」