語音識別之——mfcc什麼是漢明窗，為什麼加漢明窗

阿新 • • 發佈：2019-01-21

為什麼要加漢明窗？什麼叫加窗？

在訊號處理中，可以說加窗處理是一個必經的過程，因為我們的計算機只能處理有限長度的訊號，因此原始訊號X(t)要以T（取樣時間）截斷，即有限化，成為XT(t)後再進一步處理，這個過程式就是加窗處理，但什麼時候用什麼窗呢？這時我們就要對所需用到的函式窗做一定的瞭解。在平時，我們用得最多的是矩形窗，這個也很容易理解，好像我們屋子裡的視窗一樣，透過視窗我們可以看到外面的世界，但在如果我們理視窗遠一些的話，我們的看到的範圍將減少，越遠就越小。實際的訊號處理過程中，我們用的矩形窗，但矩形窗在邊緣處將訊號突然截斷，窗外時域資訊全部消失，導致在頻域增加了頻率分量的現象，即頻譜洩漏。避免洩漏的最佳方法是滿足整週期取樣條件，但實際中是不可能做到的。對於非整週期取樣的情況，必須考慮如何減少加窗時造成的洩漏誤差，主要的措施是使用合理的加窗函式，使訊號截斷的銳角鈍化，從而使頻譜的擴散減到最少。

首先介紹一下為什麼要用函式窗：函式窗的主要用於對截斷處的不連續變化進行平滑，減少洩漏。此外，加窗處理還有很多其它的原因，如減少噪聲干擾、限定測試的持續時間、從頻率接近的訊號中分離出幅值不同的訊號……

常見的幾種窗的基本指標：

一個窗是否合適：窗譜主瓣寬度就儘可能的窄，且能量集中在主瓣內，以獲得較陡的過渡帶；窗譜旁瓣與主瓣相比應儘可能的小，旁瓣能量衰減要快，以利於增加阻帶衰耗。

漢明窗就是訊號視窗的一種，在matlab中執行命令，畫出plot(hamming(100))的圖如下：

它主要部分的形狀像sin（x）在0到pi區間的形狀，而其餘部分都是0.這樣的函式乘上其他任何一個函式f，f只有一部分有非零值。

為什麼漢明窗這樣取呢？因為之後我們會對漢明窗中的資料進行FFT，它假設一個窗內的訊號是代表一個週期的訊號。（也就是說窗的左端和右端應該大致能連在一起）而通常一小段音訊資料沒有明顯的週期性，加上漢明窗後，資料形狀就有點週期的感覺了。

因為加上漢明窗，只有中間的資料體現出來了，兩邊的資料資訊丟失了，所以等會移窗的時候，只會移1/3或1/2窗，這樣被前一幀或二幀丟失的資料又重新得到了體現。

簡單的說漢明窗就是個函式，它的形狀像窗，所以類似的函式都叫做窗函式。希望你能明白。

2.加Hanmming窗的作用

現在在看G.723.1,對語音編碼剛入門,

發現在對訊號進行LPC分析前,對訊號乘以一個Hamming 窗,

乘法是:訊號直接乘以一個HammingWindowTable中的值,這個加窗有什麼作用?

如果是限制頻寬的話, 在時域應對訊號應做卷積的, 不明白,請賜教

因為要處理的是無限長序列中的一段，所以必須對這段序列加窗採集出來。

典型的視窗大小是25ms，幀移是10ms。漢明窗函式為

W(n,α ) = (1 -α ) - α cos(2*PI*n/(N-1))，0≦n≦N-1

一般情況下，α取0.46 。

誰能解釋一下這個函式嗎?我實在是不理解,謝謝.

由於直接對訊號（加矩形窗）截斷會產生頻率洩露，為了改善頻率洩露的情況，加非矩形窗，一般都是加漢明窗，因為漢明窗的幅頻特性是旁瓣衰減較大，主瓣峰值與第一個旁瓣峰值衰減可達40db。

舉例：

a=wavread('jiasiqi.wav');   %將音訊訊號jiasiqi.wav讀入
subplot(2,1,1),                  %分配畫布，一幅圖上共兩個圖，這是第一個
plot(a);title('original signal'); %畫出原始訊號，即前面這個音訊訊號的原始波形
grid                                    %新增網格線
N=256;                               %設定短時傅立葉變換的長度，同時也是漢明窗的長度
h=hamming(N);                   %設定漢明窗
for m=1:N                       %用漢明窗擷取訊號，長度為N，主要是為了減少截斷引起的柵欄效應等
b(m)=a(m)*h(m)
end
y=20*log(abs(fft(b)))           %做傅立葉變換，取其模值，即幅頻特性，然後用分貝（dB）表示
subplot(2,1,2)                     %分配畫布，第二副圖
plot(y);title('短時譜');            %畫出短時譜
grid                                        %新增網格線

語音識別之——mfcc什麼是漢明窗，為什麼加漢明窗

語音識別之——mfcc什麼是漢明窗，為什麼加漢明窗

孤立詞語音識別之MFCC特徵提取

語音識別之HMMS安裝和MFCC安裝

語音識別之初體驗

語音識別完成詩句的查詢功能，iOS AVSpeechSynthesis語音輸出結果的詩歌APP

Android-谷歌語音識別之離線識別（二）

孤立詞語音識別之Vector Quantization（向量量化）

android 語音識別之訊飛語音移植

語音識別之HMM演算法及其原始碼

論文筆記：語音情感識別（四）語音特徵之聲譜圖，log梅爾譜，MFCC，deltas

語音識別，語義理解一站式解決之智慧照相機(人臉識別,olami)

語音識別，語義理解一站式解決之二(android,olami)

點擊頁面的按鈕，使之打開一個新窗口，加載一個頁面的方法有哪些呢？

重磅！MaxCompute助力阿裏開源自研語音識別模型DFSMN，準確率高達96.04%

使用FFmpeg進行視頻抽取音頻，之後進行語音識別轉為文字

當語音識別搭配AI之後，我的語音助手更懂我的心了

speech_recognition實現錄音ffmpeg實現音訊檔案轉換，並用百度語音的sdk實現語音識別

年少痴狂，懷戀曾經的創業歲月，語音識別的應用遠遠未到高潮，本人的軟體原始碼開源，需要的留下Email,我給大家發

一套基於模板匹配的語音識別技術。提取語音的特徵，並建立模板庫,可以將語音識別技術應用於機器人

DTW（動態時間規準）演算法，孤立詞語音識別

語音識別之——mfcc什麼是漢明窗，為什麼加漢明窗

相關推薦