拋開不夠智慧的小娜,VoiceBot 是語音操控 Windows 更好的方案
儘管各家的智慧語音助手日益強大,但就目前而言,Siri、Google Assistant、Cortana 等尚不足以在工作或遊戲中協助我們。在這種現狀下,如果我們仍想用語音操控電腦,有沒有什麼辦法?至少在 Windows 上,答案是肯定的。
或許你已經想到,和 Mac 一樣,Windows 本身是支援語音控制的( 控制面板 → 語音識別 / 設定 → 輕鬆使用 → 語音 → 開啟語音識別 )。但是,我們從這個功能的開啟方式和 「 Windows 語音識別命令 」 中可以感受到,似乎它更多地是作為「輕鬆使用」的一部分,幫助不便使用滑鼠、鍵盤的人士來操控電腦。

這樣的語音操控方式並不能算是「用語音操控 Windows」。本文不是一篇介紹 Windows 原生語音控制功能的文章,而是旨在介紹一款把控制 Windows 的方式拓展到語音的軟體: VoiceBot 。
為什麼使用 VoiceBot?
使用 VoiceBot 最基本的原因是它的功能較為完善、穩定,且有較高自由度。
在此基礎上,VoiceBot 和其他同類軟體相比(例如 GAVPI 、 VoiceAttack ),在介面、售後、技術支援、易用性等方面更有優勢。
除此之外,如果你克服了對著電腦下命令的莫名「羞恥感」(或之類的東西),以簡單命令觸發一系列自動化操作的功能,的確能免除你部分重複而繁瑣的操作,還能讓你的雙手得到休息,釋放部分壓力。
在遊戲中使用 VoiceBot 或許能增添遊戲的趣味。例如,你可以在策略類遊戲「文明」中,讓語音命令「退朝」對應遊戲中點選進入下一回合的操作。或者將某遊戲中使用技能的快捷鍵對應為某句「咒語」。
如果你有更豐富的想象力,那你能用 VoiceBot 帶來的改變和趣味或許會超出其他人。
VoiceBot 介面介紹
從兩個最基礎的介面開始介紹 VoiceBot 。
VoiceBot 配置檔案介面

上圖是 VoiceBot 中編輯配置檔案(Profile)的介面。一個配置檔案是一組巨集的集合,是用於同一情景下的一組語音命令規則。例如,在使用 QQ 郵箱時,語音命令「刪除郵件」可能代表將滑鼠移至某處再單擊;而在使用 Gmail 時,「刪除郵件」命令可能要將滑鼠移至 Gmail 中刪除郵件按鈕所在的位置再單擊。不同的情境下同樣的語音命令可能代表不同的操作。在不同的情景下使用不同的配置檔案,可以避免出現語音命令錯誤、混淆等問題 。值得注意的是,切換配置檔案這一行為也能通過語音完成,不必開啟軟體進行操作。
「必需」區域中有「配置名稱」和「配置檔案語言」兩項。
-
「配置名稱」:事實上,配置檔案的名稱可以和其他配置檔案重複,不過若沒有特殊需求,非常不建議這樣做。
-
「配置檔案語言」:每個配置檔案只能設定一種目標語言,而不同的配置檔案可以使用不同的目標語言。「新增識別器」這一按鈕似乎已經失效,此時可以通過 設定 ( Win 鍵 + I ) → 時間和語言 → 區域和語言 → 新增語言 來新增其他語言的識別器,用其他語言來對 VoiceBot 下命令。這也意味著,你能在 VoiceBot 中使用所有 Windows 能識別的語言。
「巨集」區中是此配置檔案中包含的所有巨集,或者說語音命令規則(如果這樣說更好理解)。一個巨集可以有如下屬性(標「*」為必需):
-
名稱*
-
巨集熱鍵:綁定了熱鍵(快捷鍵)的巨集可以用快捷鍵啟用。
-
命令*:「命令」即需要說出的語音指令,預設情況下和名稱相同,取消選中「名稱用作命令」後可以設定為不同的內容。
-
組*:雖然是必需的項,但實際上此項不可能為空。預設情況下,新建的巨集屬於「常規」組。可以新增組。
-
動作*:「動作」即語音指令對應的操作。一條語音指令可以對應單個或多個動作,並且動作之間可以新增延遲或註釋。
「可選」區域有如下五項內容,都不是一個配置檔案所必需的:
-
命令字首:如果一個配置檔案設定了命令字首,那麼使用時每個命令都必須加上此字首,才會被 VoiceBot 識別執行。例如在有和沒有命令字首「嗯」這兩種情況下,應使用的語音命令分別是「嗯返回桌面」和「返回桌面」。在 VoiceBot 設定中可以設定全域性的命令字首,但是此處的設定會被配置檔案中的覆蓋。另外,似乎 VoiceBot 不支援中文的命令字首。如果各位有興趣的話不妨給我反饋。
-
關聯此配置檔案和指定程式:其實這項應該翻譯為「關聯此配置檔案至指定程式」。如果一個配置檔案和某程式關聯,那麼如果此程式沒有執行,就算啟用了配置檔案、說對了語音指令也不會起效。
-
配置檔案熱鍵:此項功能和「巨集熱鍵」的功能相似,設定好後,就能通過按下特定的快捷鍵來啟用某一配置檔案。
-
描述:配置檔案的描述。
-
已連結的 WallpaperFusion 標籤:如果從給出的標籤列表裡選中了某一標籤,那麼使用該配置檔案時,主檢視中會載入相應的圖片。如果沒有選定,主檢視中圖片會隨機載入。

VoiceBot 主檢視

上圖是 VoiceBot 的主檢視(當主檢視位於所有視窗中最前時,VoiceBot 不會執行識別出的語音命令)。從上到下,我們可以看到一個工具欄、兩個窗格和一個橫幅圖片。
工具欄左部顯示當前使用的配置檔案,單擊後出現選擇配置檔案等的下拉選單。相鄰的兩個按鈕從左到右依次是「編輯配置檔案」和「下載預製配置檔案」。在右部,先是「用於 VoiceBot 的音訊輸入裝置」(當沒有其他裝置可選時此項為灰色),它旁邊依次是「暫停(開始)」「清除日誌」(接下來就會說明何為日誌)「設定」「幫助」和「退出」。
兩個窗格中,左部較窄的窗格顯示當前配置檔案所包含的巨集及巨集對應的「命令」,不同組的巨集分開顯示。雙擊某個巨集即可快捷地跳轉至其編輯介面。
右部較寬的窗格顯示本次 VoiceBot 執行的日誌,即所識別出的語音以及(如果有)對應的巨集和巨集所代表的「動作」。可以設定只記錄匹配了「命令」的語音。
底部的橫幅圖片,正如剛才在「已連結的 WallpaperFusion 標籤」中所介紹的,如果配置檔案有相關設定,會載入特定圖片,如果沒有設定,則會隨機載入圖片。除了圖片之外,底部還有一條隨聲音大小而起伏的線。若當前無聲音,則線之下為黑色,若有聲音,線之下變為藍色。

VoiceBot 的功能
在 VoiceBot 的官網上有一段簡介,清楚地介紹了 VoiceBot 的核心功能:
VoiceBot lets you take command with your voice! Say commands out loud to send actions to your games and applications. Use your voice to type keyboard shortcuts, click and move your mouse, and execute macros and scripts.
簡單地說,在 VoiceBot 中的巨集能完成以下「動作」:
-
鍵入快捷鍵
-
控制滑鼠
-
執行巨集指令碼
-
更改音訊裝置
-
開啟檔案或程式
-
播放聲音
-
文字轉語音
-
輸入文字
接著我們來詳細介紹這些「動作」。
鍵入快捷鍵

快捷鍵由按鍵方式和按鍵內容組成。VoiceBot 支援的按鍵方式有四種:
-
按下並釋放按鍵
-
按下按鍵
-
釋放按鍵
-
切換鍵
前三種按鍵方式很好理解,最後一種「切換鍵(Toggle Key)」指的是根據當前選定鍵的狀態,按下或釋放按鍵。如果選中的按鍵方式是「按下並釋放按鍵」,則還可以設定按住的時長(以毫秒為單位),預設時長為 100 毫秒。
至於按鍵的內容,可以看到編輯按鍵的介面有四個灰色的按鍵(單擊選中後即變為藍色),分別是:Shift、Ctrl、Win 鍵和 Alt,這四個鍵可以有無任意組合(即可以組合出 16 種可能)。白框中可以再加入一個任意鍵。加入方法有兩種,一種是點選白框使光標出現於此後,直接在鍵盤上按下目標鍵,另一種是點選白框右側的黑色箭頭,從彈出選單中選擇某個鍵。
控制滑鼠

VoiceBot 能控制滑鼠完成如下動作:
-
單擊
-
雙擊
-
按下滑鼠
-
釋放滑鼠
-
移動滑鼠
-
滾動滑鼠滾輪
前四項的編輯面板和快捷鍵的編輯面板大同小異,除了在白框中直接點選滑鼠目標鍵之外,還可以從彈出選單中選擇。

移動滑鼠分為兩種模式,都是根據座標移動。一種是絕對移動,將滑鼠移動至指定座標;一種是相對移動,此時填入的就不是目標座標,而是指定的座標增量。VoiceBot 提供檢視滑鼠座標的功能。在絕對移動模式下點選「顯示選擇器」後,再點選目標位置,目標位置的座標就會自動填入編輯面板內。

如圖所示,滾動滑鼠滾輪和點選滑鼠時,都可設定按下 Shift、Ctrl、Win 鍵和 Alt 中的某個或某些。
巨集指令碼
VoiceBot 支援以 C# 或 Visual Basic 編寫巨集指令碼,也可以下載預製巨集指令碼。本文不涉及相關內容,如果您對在 VoiceBot 中使用巨集指令碼感興趣,可以訪問官方的 相關幫助頁面 瞭解詳細內容。
更改音訊裝置 & 開啟檔案或程式 & 播放聲音

VoiceBot 支援更改聲音和通訊的回放和錄製裝置,也支援開啟任意檔案或執行任意程式。VoiceBot 以相應的系統預設軟體開啟指定檔案,執行程式時能夠給程式傳遞命令列引數。用 VoiceBot 開啟檔案和播放聲音的操作基本相同。
文字轉語音 & 輸入文字

VoiceBot 能將特定文字轉為語音並播放。並且還可以選擇使用的語音聲音或 下載更多的語音聲音 。使用者還可以按自己的喜好或需求設定語音的音量和速度。這些設定項也可以在 VoiceBot 的「設定」裡面更改,但是「動作」中的設定優先順序更高。
輸入文字的功能很簡單,就像輸入法的自定義短語一樣,就是輸入特定的文字內容(而不是語音轉文字)。
其他功能
除了這些「動作」之外,VoiceBot 還有一些提升使用體驗的功能:
- 如果使用者註冊了 Binary Fortress 賬戶(不註冊賬戶不影響使用軟體),那麼使用者可以將自己的配置檔案同步到 VoiceBot 的伺服器上。這樣,通過登陸自己的賬戶,就可以在任何地方使用自己的配置檔案,也不用擔心因為系統故障等原因而丟失自己辛辛苦苦編輯的配置檔案。

- VoiceBot 支援使用者分享自己編輯的配置檔案,提供給其他使用者下載使用。目前,已有較多配置檔案被分享,但其中大多數是適用於英語的檔案,適用於中文的配置檔案只有十幾個。若非特別緊急的情況,大家不妨自己編輯自己的配置檔案,這樣使用起來更加「順手」。另外,如果只想傳送給朋友的話,VoiceBot 提供配置檔案的匯出、匯入功能。

如何購買 VoiceBot
如果您想購買 VoiceBot 這款軟體,有多種途徑可以選擇。例如在 官網購買 、在 Steam 購買 和在 數碼荔枝購買 。
VoiceBot 的授權版本
在官網的銷售頁面,我們可以看到 VoiceBot 的授權分四個版本(包括免費版在內)。

本文並沒有截出不同版本可用功能對比的表格,因為除了免費版有所限制之外,其他三個版本在此方面並沒有任何區別。
Steam 版的 VoiceBot 和 Steam 上大部分遊戲或軟體的授權模式相同——不限制安裝的裝置數,可終身更新(所有的版本都是這樣)。而且在官網的授權詳情中可以看到,所有收費版本都是可以商業使用的。
數碼荔枝出售的 VoiceBot 所標註的版本是「專業版」,但在授權詳情中有說明,此版本的 VoiceBot 只能用於一臺裝置。和官網的相對比可知,數碼荔枝出售的應該是「Pro Standard」版本,具體的授權說明是:「Personal or Company, 1 computer」。
「Pro Personal」版不在數碼荔枝和 Steam 出售,它和「Pro Standard」版的區別在於,「Pro Personal」版能使用於不限數量的個人電腦,和 一臺 僅自己使用的公司電腦。
VoiceBot 的價格

上表列出了不同平臺 VoiceBot 的「正常」價格。一般情況下,數碼荔枝會有幾元的折扣。而 Steam 上的 VoiceBot ,在促銷時(例如夏促)價格可能會降到 21 元。

我們可以看到,無論是從價格上,還是從授權上,在 Steam 購買都是最好的選擇——除非你決定在不能使用 Steam 的電腦使用你的 VoiceBot。
其他
最後有幾點附加說明。
-
限於篇幅,本文並沒有介紹出 VoiceBot 的全部功能。
-
VoiceBot 的語音識別能力受複雜因素影響,有人在 Steam 反饋說根本用不了,我用起來覺得還行。
- 在 Steam 購買還有一個好處。Steam 的退款政策是,在購買後兩週內,如果使用時間不超過兩小時,可以申請退款。各位感興趣的話不妨在 Steam 買來試試,不喜歡再退款,到賬很快的。