微軟展示詭異的Silent Voice無聲語音通訊技術演示
微軟致力於開發一種新的語音輸入介面,允許使用者在沒有聲音出現的情況下進行說話和錄音。該研究由微軟研究院進行,並在ACM CHI 2018中進行了介紹。 這種技術被稱為SilentVoice通過錄制呼吸時發出的聲音來實現通訊,這種允許類似耳語的聲音就足夠讓麥克風錄製語音而不會打擾周圍的人。此外,該模組還將過濾周圍的語音,因此即使有外界干擾,使用者也可以捕獲清晰的語音。
訪問:
ofollow,noindex">微軟中國官方商城 - 首頁
SilentVoice是一種新的語音輸入介面裝置,可以在日常生活中利用基於語音的自然使用者介面(NUI)。
所提出的“漸進式語音”方法能夠將麥克風放置在非常靠近嘴的前部而不受噪聲的影響,捕獲具有良好S/N比的非常柔和的語音。它實現了超小(低於39dB(A))的語音洩漏,允許使用語音輸入,而不會在公共和移動情況以及辦公室和家庭中煩擾周圍的人。(終於不會打擾到人用TNT啦!)
通過測量氣流方向,SilentVoice可以輕鬆地讓外部聲音與正常話語分離,準確度達98.8%,在語音通訊啟動前不需要念啟用詞。它還可以配合帶有經過專門訓練的語音識別器的語音啟用系統,評估結果產生的單詞錯誤率(WERs)為1.8%(說話者依賴條件),7.0%(說話者無條件),包含有85個命令句,這意味著類似耳語的自然語音也可用於實時語音通訊。
您可以在ACM CHI計算系統會議上檢視完整的簡報:
該技術仍處於研究階段,但肯定會幫助那些喜歡使用語音命令但喜歡在不打擾周圍人的情況下工作的人。