A Bayesian Approach to Deep Neural Network Adaptation with Applications to Robust Automatic Speech Recognition

阿新 • • 發佈：2018-06-07

機器學習屬於瓶頸特征 oid ack enter 變換表示

基於貝葉斯的深度神經網絡自適應及其在魯棒自動語音識別中的應用

直接貝葉斯DNN自適應

使用高斯先驗對DNN進行MAP自適應

為何貝葉斯在模型自適應中很有用？

因為自適應問題可以視為後驗估計問題：
能夠克服災難性遺忘問題
在實現通用智能時，神經網絡需要學習並記住多個任務，任務順序無標註，任務會不可預期地切換，同種任務可能在很長一段時間內不會復現。當對當前任務B進行學習時，對先前任務A的知識會突然地丟失，這種現象被稱為災難性遺忘（catastrophic forgetting）。

DNN的MAP自適應：理論背景

基於GMM系統的MAP

自適應

GMM作為生成性pdf：符合直覺

技術分享圖片

共軛先驗（Conjugate Prior）

在貝葉斯統計中，如果後驗分布與先驗分布屬於同類，則先驗分布與後驗分布被稱為共軛分布，而先驗分布被稱為似然函數的共軛先驗。

具體地說，就是給定貝葉斯公式

技術分享圖片

基於DNN的MAP自適應

但是DNN是鑒別性模型，它沒有生成性後驗概率的概率密度函數。

使得DNN近似為概率密度函數

將DNN看作是一個概率密度函數
將DNN的目標函數以概率（似然）形式表示：
估計後驗概率

其中似然L可以是交叉熵、最小互信息、最小音素錯誤、最小分類錯誤等。

先驗估計：經驗貝葉斯

對訓練說話人進行自適應，並分析說話人直接的參數分布。

技術分享圖片

Prior Estimation Cont‘d（先驗估計，接上頁）

con‘d, Abbreviation of continued, 接上頁

假設先驗分布為多元高斯

技術分享圖片

等式右邊，只用矢量w完成了對矩陣W的表示（向量化）。

假設先驗分布為矩陣高斯

技術分享圖片

多元高斯與矩陣高斯的結果類似，不過多元高斯先驗使用了向量化，更易於處理、更易於簡化至到L2正則項。

高斯先驗：易於簡化至到L2正則項

多元高斯先驗的展開式：
L2正則化訓練

DNN自適應中的災難性遺忘

自適應後，DNN對自適應數據中見過的類有偏差；

喪失對未觀察到樣本的識別能力

貝葉斯用於解決災難性遺忘問題

技術分享圖片

控制參數數量（LHN）

只對插入到線性隱層的仿射變換權重進行適應：凍結其他參數

通常使用一個瓶頸層以控制LHN的大小，進一步較少參數數量。

MAP：只更新激活函數參數

適應隱層中Sigmoid激活函數（AF）參數

技術分享圖片

此方法更新的參數比LHN更少。

實驗（SWBD）

保持權重不變，只更新AF參數，WER降低4.6%（15.1->14.4）
在此基礎之上，以最大後驗概率準則更新AF參數，WER進一步降低2.8%（14.4->14.0）
進行特征空間最大似然線性回歸（fMLLR），WER降低7.9%（15.1->13.9）
在此基礎之上，以最大後驗概率準則更新AF參數，WER進一步降低5.0%（13.9->13.2）

間接貝葉斯DNN自適應

對從DNN獲得瓶頸特征進行MAP/SMAP

對DNN的直接自適應是可行的，但是還是比不上對GMM的貝葉斯自適應。
如何更好地利用成熟的貝葉斯自適應方法
將DNN轉換為GMM

基於DNN瓶頸特征處理後的特征進行MAP/SMAP

技術分享圖片

瓶頸特征是鑒別性數據驅動方式訓練的；

通過拼接以使用DNN的優點；

要獲得瓶頸特征：

訓練一個帶有瓶頸層的DNN；
訓練一個不帶有瓶頸層的DNN，然後進行奇異值分解（SVD）以得到瓶頸；
不使用瓶頸層，只進行PCA/LDA降維；

MAP/SMAP自適應

MAP

是有效的模型自適應方法，對小數據集魯棒；

數據量很大時，將蛻化至（相當於）最大似然估計（MLE）；

會由於缺少數據，不能更新未見的三音素；

SMAP（Structured MAP）

針對少數據量的結構化MAP自適應

MAP/SMAP實驗

瓶頸特征的GMM-HMM略微差與原DNN-HMM（基線）結果（WER提高0.2%，8.84->8.86）

對瓶頸特征進行MAP的GMM-HMM WER降低5.2%（8.84->8.38）

對瓶頸特征進行SMAP的GMM-HMM WER降低11.1%（8.84->7.85）

與MAP-LHN、LHN相比，SMAP最優。

總結

直接DNN自適應：

使用高斯先驗進行有監督/無監督的自適應
多任務學習（MTL）自適應以解決數據稀疏問題
自適應時，需要對DNN構建一個框架。使用已提出的框架，可以將DNN應用到不同種類型的模型與不同的任務中。

通過瓶頸特征，將DNN"轉換"為生成性模型

使用瓶頸特征將DNN-HMM轉換為GMM-HMM
為DNN提供了使用傳統統計學機器學習方法（包括貝葉斯方法）

A Bayesian Approach to Deep Neural Network Adaptation with Applications to Robust Automatic Speech Recognition

機器學習屬於瓶頸特征 oid ack enter 變換表示基於貝葉斯的深度神經網絡自適應及其在魯棒自動語音識別中的應用直接貝葉斯DNN自適應使用高斯先驗對DNN進行MAP自適應為何貝葉斯在模型自適應中很有用？因為自適應問題可以視為後驗估計

How to train Neural Network faster with optimizers?

from:https://towardsdatascience.com/how-to-train-neural-network-faster-with-optimizers-d297730b3713 AsI worked on the last article, I had the o

A Deep Neural Network Approach To Speech Bandwidth Expansion

題名：一種用於語音頻寬擴充套件的深度神經網路方法作者：Kehuang Li；Chin-Hui Lee 2015年出來的摘要　　本文提出了一種基於深度神經網路(DNN)的語音頻寬擴充套件(BWE)方法。利用對數譜功率作為輸入輸出特徵進行所需的非線性變換，訓練神經網路來實現這種高維對映函式。在10小

論文閱讀筆記十八：ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

每一個內核基於 proc vgg 包含 rep 重要偏差論文源址：https://arxiv.org/abs/1606.02147 tensorflow github: https://github.com/kwotsin/TensorFlow-ENet 摘要

Multi-View Gait Recognition Based on A Spatial-Temporal Deep Neural Network論文翻譯和理解

Multi-View Gait Recognition Based on A Spatial-Temporal Deep Neural Network論文翻譯和理解翻譯格式：一句英文，一句中文結合圖來講解 ABSTRACT ABSTRACT This paper p

[譯]A Bayesian Approach to Digital Matting

最近在看關於Matting的文章，這篇論文算是比較經典的老論文了，所以翻譯過來，閱讀更加方便些。文章翻譯大部使用谷歌線上翻譯，對其中小部分錯誤進行了修正。 A Bayesian Approach to Digital Matting 1、Introduction In

論文筆記：TextBoxes: A Fast Text Detector with a Single Deep Neural Network

在自然場景中，場景文字（Scene text）是最常見的視覺物件（visual objects）之一。經常出現在路標，車牌，產品包裝袋上等等。閱讀場景文字產生了很多有用的應用，例如基於圖片的地理定位（image-basedgeolocation）。儘管它和傳統的OCR很相似，但是場景文字的閱讀更具有挑戰性，因

Building your Deep Neural Network: Step by Step¶

pan auto plot chan arr src computing zeros rect Welcome to your week 4 assignment (part 1 of 2)! You have previously trained a 2-layer N

Deep Neural Network for Image Classification: Application

cal pack 分享圖片 his exp params next min super When you finish this, you will have finished the last programming assignment of Week 4, and a

01神經網路和深度學習-Deep Neural Network for Image Classification: Application-第四周程式設計作業2

一、兩層神經網路模型：LINEAR->RELU->LINEAR->SIGMOID #coding=utf-8 import time import numpy as np import h5py import matplotlib.pyplot as

Deep Neural Network Compression by In-Parallel Pruning-Quantization 論文筆記

乘法搜索 ron 級別結合們的記憶加權共享摘要深度神經網絡在視覺識別任務（如圖像分類和物體檢測）上實現了最先進的精確度。然而，現代網絡包含數百萬個已學習的連接，並且當前的趨勢是朝向更深和更密集連接的體系結構。這對在資源受限的系統（例如智能手機或移動機器人）上

CNN與為什麼要做DNN（Deep neural network)(李弘毅機器學習）

CNN整體過程 1.整體架構卷積操作（convolution):可以進行卷積操作是因為對於影象而言，有些部分割槽域要比整個影象更加重要。並且相同的部分會出現在不同的區域，我們使用卷積操作可以降低成本。比如，我們識別鳥，鳥嘴部分的資訊很重要，通過這個鳥嘴，我

2018/12/14 Deep Neural Network Training(1)

Loss Function and Optimization 損失函式如何優化線性分類器損失函式是量化的評估線性分類器的標準。損失函式是優化的目標。損失函式的定義：當初始化W很小的時候，S–>0,此時L–>c-1（其中c代表類的個數）

神經網路與深度學習第四周-Building your Deep Neural Network

Building your Deep Neural Network: Step by StepWelcome to your week 4 assignment (part 1 of 2)! You have previously trained a 2-layer Neur

Automatic Speech Recognition: A Deep Learning Approach (Signals and Communication Technology): Dong Yu, Li Deng: 9781447157786:

This book provides a comprehensive overview of the recent advancement in the field of automatic speech recognition with a focus on deep learn

A Bayesian Approach to Deep Neural Network Adaptation with Applications to Robust Automatic Speech Recognition

A Bayesian Approach to Deep Neural Network Adaptation with Applications to Robust Automatic Speech Recognition

How to train Neural Network faster with optimizers?

A Deep Neural Network Approach To Speech Bandwidth Expansion

論文閱讀筆記十八：ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

Multi-View Gait Recognition Based on A Spatial-Temporal Deep Neural Network論文翻譯和理解

[譯]A Bayesian Approach to Digital Matting

論文筆記：TextBoxes: A Fast Text Detector with a Single Deep Neural Network

Building your Deep Neural Network: Step by Step¶

Deep Neural Network for Image Classification: Application

01神經網路和深度學習-Deep Neural Network for Image Classification: Application-第四周程式設計作業2

Deep Neural Network Compression by In-Parallel Pruning-Quantization 論文筆記

CNN與為什麼要做DNN（Deep neural network)(李弘毅機器學習）

2018/12/14 Deep Neural Network Training(1)

神經網路與深度學習第四周-Building your Deep Neural Network

Automatic Speech Recognition: A Deep Learning Approach (Signals and Communication Technology): Dong Yu, Li Deng: 9781447157786:

第四周程式設計作業（二）-Deep Neural Network for Image Classification: Application

吳恩達深度學習1-4課後作業1 Building your Deep Neural Network: Step by Step

神經網路與深度學習第四周-Deep Neural Network

Coursera deep learning 吳恩達神經網路和深度學習第四周程式設計作業 Building your Deep Neural Network

Deep Neural Network for Image Classification:Application

A Bayesian Approach to Deep Neural Network Adaptation with Applications to Robust Automatic Speech Recognition

相關推薦