使用C#進行語音識別(Speech-to-Text)

阿新 • • 發佈：2019-01-24

本文大體的介紹怎樣通過使用C#和Speech SDK5.1來進行語音識別，通過微軟提供的Speech SDK你也可以使用其他的語言進行語音識別的開發，目前最新的Release版本是5.1。

介紹

聲音的交流是我們平時最常見的交流方式，但是在人與計算機之間似乎就不那麼一樣的常見了，我想原因是如果一個應用程式僅僅用聲音來控制的話，呵呵，那要是人撒謊計算機就慘了。雖然使用聲音來作為應用程式的錄入不是什麼新東西了，但是目前採用語音錄入的應用程式還不是那麼的常見，換句話說，語音的開發仍然有很大的潛力和空間。

語音識別引擎

語音識別引擎有兩種不同的識別引擎，一種叫Shared識別引擎，另外一種叫做Inpro識別引擎，相信大家通過名字也能大概猜到了他們的不同了吧！Shared識別引擎能夠被多個應用程式共享使用，通常這個語音引擎用於多個應用程式需要語音輸入的時候。雖然Inpro識別引擎不像Shared引擎那樣被多個Application共享但是在一個大型的在獨立的伺服器上執行的語音系統中我們推薦使用它。

語音識別引擎通過使用事件的方式和應用程式產生互動，在許多的事件中最重要的是recognition event 和 hypothesis event，這兩個事件在語音識別引擎在recognition或者hypothesis識別到時觸發。下面的程式碼說明了怎樣去簽名這些事件：

// 得到一個RecoContext例項.
   objRecoContext = new SpeechLib.SpSharedRecoContext();
            // 指派一個事件給Hypothesis Event(中間層暫定的識別，即，初級的，臨時的識別).
   objRecoContext.Hypothesis += new _ISpeechRecoContextEvents_HypothesisEventHandler(Hypo_Event);
   // 指派一個事件給語音識別.
   objRecoContext.Recognition += new _ISpeechRecoContextEvents_RecognitionEventHandler(Reco_Event);
   //建立grammer例項.
   grammar = objRecoContext.CreateGrammar(0);

   label3.Text = "Speak Out one of the follwoing./r/n1. New 2. Open 3. Close 4. Exit/r/n5. Cut 6. Copy 7. Paste 8. Delete";

//啟用選單命令.
menuRule = grammar.Rules.Add("MenuCommands",SpeechRuleAttributes.SRATopLevel|SpeechRuleAttributes.SRADynamic,1);

object PropValue = "";

menuRule.InitialState.AddWordTransition(null,"Paste"," ",SpeechGrammarWordType.SGLexical,"Paste",1, ref PropValue, 1.0F );
menuRule.InitialState.AddWordTransition(null,"Delete"," ",SpeechGrammarWordType.SGLexical,"Delete",2, ref PropValue, 1.0F );

grammar.Rules.Commit();
grammar.CmdSetRuleState("MenuCommands", SpeechRuleState.SGDSActive);

下面顯示了主要的執行視窗

示例下載(檔案提取碼： 1176475894201735)

摘要：這篇文章對使用Speech SDK 5.1語音識別作了簡單的介紹。

使用C#進行語音識別(Speech-to-Text)

介紹

語音識別引擎

使用C#進行語音識別(Speech-to-Text)

IBM的語音識別（IBM speech to text 語言轉換成文字）

IBM Cloud Speech to Text 語音識別

使用FFmpeg進行視頻抽取音頻，之後進行語音識別轉為文字

一種利用語音深度神經網路進行語音識別的新方案

用C#進行影象識別與資料採集進而實現對視訊裡的資料採集

使用FFmpeg進行視訊抽取音訊，之後進行語音識別轉為文字

Building with Watson: Advanced audio transcription with Speech to Text

Csharp: speech to text, text to speech in win

kaldi使用cvte模型進行語音識別

C++語音識別介面快速入門（Microsoft Speech SDK）——文字轉語音

使用微軟的語音識別引擎Microsoft Speech API進行語音控制

C#語音識別用法實例

在C#中使用科大訊飛Web API進行語音合成

C#用Tesseract進行OCR識別，可識別中英日韓所有語言

c# OpenCv 2-使用haarcascade模型進行人臉識別

C# 利用百度AI進行人臉識別/搜尋

一個基於Windows Vista speech API5.3以及WPF技術的語音識別程式碼

一個基於c#3.0的開發基於2000/XP/2003下語音識別的通用類

C#下用Emgucv對圖片進行灰度化、二值化、邊緣檢測、膨脹腐蝕運算、霍夫變換進行表格識別

使用C#進行語音識別(Speech-to-Text)

介紹

語音識別引擎

相關推薦