1. 程式人生 > >公開課 | 詳解CNN-pFSMN模型以及在語音識別中的應用

公開課 | 詳解CNN-pFSMN模型以及在語音識別中的應用

 

近年來,在深度學習技術的幫助下,語音識別取得了極大的進展,從實驗室開始走向市場,走向實用化。基於語音識別技術的輸入法、搜尋和翻譯等人機互動場景都有了廣泛的應用。

Librispeech是當前衡量語音識別技術的最權威主流的開源資料集。錯詞率(Worderrorrate,WER)是衡量語音識別技術水平的核心指標。近日,雲從科技在Librispeech資料集上將錯詞率(Worderrorrate,WER)降到了2.97%,較之前提升了25%。超過阿里、百度、約翰霍普金斯大學等企業及高校,大幅重新整理原先記錄。

本次公開課中,我們邀請到了雲從科技資深演算法研究員楊學銳,他將在本次公開課中詳解CNN-pFSMN模型在語音識別中的應用,並提供了豐富的進階資料。

即刻掃碼,免費報名↓↓↓

 

▌課程資訊

主題:詳解CNN-pFSMN模型以及在語音識別中的應用

時間:11 月 22 日  20:00-21:00(下週四)

地點:免費線上直播

▌分享嘉賓

楊學銳

楊學銳,雲從科技語音識別資深演算法研究員,復旦大學碩士,多年機器學習及語音技術研究經歷,提出的CNN-pFSMN模型打破語音識別世界紀錄。

▌適合物件

一線工程師,轉型中的開發者,學生

▌課程大綱

1.大規模詞彙連續語音識別

2.LVCSR前沿與最新進展

3.CNN-pFSMN聲學模型

4.進階資源推薦

▌課程安排

19:45—20:00 學員提前入場

20:00—20:50 講師課程分享

20:50—21:00 講師答疑環節

▌溫馨提醒

1、開課前會有簡訊提醒或者郵件提醒,請報名的時候填寫正確的手機號碼及郵箱地址。

2、開課後 2-3 個工作日內會上傳本節課的視訊回放,報名後回放視訊不限時觀看。

掃碼新增小助手,回覆:語音識別,加入講師課程交流群,嘉賓 PPT 及整理筆記將在直播結束後在群內公開。