【資訊科技】【2005.12】【含原始碼】基於幅度譜拉普拉斯運算元MMSE估計器的語音增強

阿新 • • 發佈：2018-12-16

在這裡插入圖片描述本文為美國德克薩斯大學達拉斯分校（作者：BIN CHEN）的博士論文，共113頁。

多年來，人們研究了大量基於MMSE譜估計的語音增強演算法。雖然這些演算法中的一部分是基於拉普拉斯和伽瑪分佈的，但是沒有給出最優譜幅度估計。本文主要研究語音增強的幅度譜最優估計。本文給出了用拉普拉斯分佈模擬純語音DFT係數、用高斯分佈模擬噪聲DFT係數時，在MMSE意義下估計幅度譜的解析解。此外，我們推導了語音存在不確定性和拉普拉斯統計模型下的MMSE估計。結果表明，與傳統的基於高斯的MMSE估計相比，基於拉普拉斯的MMSE估計在增強後的語音中產生較少的殘留噪聲。總的來說，本研究表明DFT係數的分佈假設對增強語音的質量有顯著影響。

A number of speech enhancement algorithms based on MMSE spectrum estimators have been proposed over the years. Although some of these algorithms were developed based on Laplacian and Gamma distributions, no optimal spectral magnitude estimators were derived. This dissertation focuses on optimal estimators of the magnitude spectrum for speech enhancement. We present an analytical solution for estimating in the MMSE sense the magnitude spectrum when the clean speech DFT coefficients are modeled by a Laplacian distribution and the noise DFT coefficients are modeled by a Gaussian distribution. Furthermore, we derive the MMSE estimator under speech presence uncertainty and a Laplacian statistical model. Results indicated that the Laplacian-based MMSE estimator yielded less residual noise in the enhanced speech than the traditional Gaussian-based MMSE estimator. Overall, the present study demonstrates that the assumed distribution of the DFT coefficients can have a significant effect on the quality of the enhanced speech.

1 引言

2 歷史文獻回顧

3 基於拉普拉斯的MMSE STSA估計器

4 語音不確定條件下的幅度估計器

5 演算法實現與效能評估

6 總結

附錄A 用復拉普拉斯分佈的DFT係數推導譜幅度的概率密度函式PDF

附錄B 推導近似拉普拉斯MMSE估計器

附錄C 推導條件密度函式

附錄D 基於有限元法的數值積分技術

附錄E 目標效能評估方法

附錄F MATLAB原始碼

在這裡插入圖片描述

下載英文原文地址：

更多精彩文章請關注微訊號：在這裡插入圖片描述

【資訊科技】【2005.12】【含原始碼】基於幅度譜拉普拉斯運算元MMSE估計器的語音增強

【資訊科技】【2005.12】【含原始碼】基於幅度譜拉普拉斯運算元MMSE估計器的語音增強

【資訊科技】【2005】影象紋理工具研究——紋理合成、紋理轉移與合理復原

【資訊科技】【2006.12】人工耳蝸在噪聲環境中更好地識別旋律並改善語音理解的訊號處理策略

【資訊科技】【2010.12】利用影象處理實現實時事故檢測系統的有效步驟

【資訊科技】【2002.04】基於區域性分割的數字影象處理

【資訊科技】【2004.05】雙耳語音識別研究：聲與電的聽覺

【資訊科技】【2014.01】智慧交通監控中運動目標檢測與跟蹤方法研究

【資訊科技】【2015.09】航空視訊中的車輛自動檢測與跟蹤

【資訊科技】【2006】熵與語音

【資訊科技】【2015.05】【含原始碼】基於彩色色調影象處理的目標跟蹤

【資訊科技】【2013.05】【含部分原始碼】數字影象處理的手機照片增強技術

【資訊科技】【2011】【含部分原始碼】影象處理和機器學習技術在數字乳腺影象中癌組織檢測與分類的應用

【資訊科技】【2004.08】高度非平穩環境下的噪聲估計演算法

【資訊科技】【2013.08】觀察蜜蜂活動的自動影象處理系統的實現

【資訊科技】【2009】基於線上維特比優化和隨機建模的多目標跟蹤

【雷達與對抗】【2000】【含原始碼】FMCW雷達測量雪層厚度的建模與模擬分析

【電腦科學】【2018.02】【含原始碼】一種目標分類的深度學習預測模型

【電腦科學】【2017.11】【含原始碼】用於超光譜影象畫素分類的深度學習研究

【雷達與對抗】【2012.05】【含原始碼】合成孔徑雷達：一種用於ESAs Wavemill任務的實時處理器

【電腦科學】【2011.05】【含原始碼】微陣列資料的SVM分類與邊緣距離分析

【資訊科技】【2005.12】【含原始碼】基於幅度譜拉普拉斯運算元MMSE估計器的語音增強

相關推薦