1. 程式人生 > >【AI測試】智慧音箱--自然語言處理,語音語義識別測試

【AI測試】智慧音箱--自然語言處理,語音語義識別測試

自己目前沒有做過自然語言處理,語音語義識別測試,本文為聽一場語音語義識別測試分享學習所得,以及結合網上學習資料整理。

語音識別測試

主要考慮距離、噪聲、不同手機機型或硬體、不同網路

  • 噪音干擾識別測試
  • 不同距離識別測試
  • 不同機型識別測試
  • 不同網路語音識別速度測試
  • 監測靈敏度測試
  • 競品對比測試

語義識別測試

測試人員大部分時間會花在構造語義測試資料階段。儘可能的收集各種語境和語義輸入。
在這裡插入圖片描述

構造語義測試資料的方法:

釋出前

語義測試開展(構造語義測試資料的四個階段)

  1. 人工腦暴資料

  2. 實體擴充

    • 模板庫 + 實體庫自動化生成資料
    • 熱門實體庫更新(實體庫為FM節目、FM專輯、音樂熱歌、音樂新歌等)
      在這裡插入圖片描述
  3. 針對人說話特點以及音箱場景做專項定製化資料增長

    • 同音字替代
    • 實體少字
    • 模糊音替代
    • 干擾語氣詞
    • 重疊字
    • 實體顛倒
    • 實體含英文,數字等
      在這裡插入圖片描述
  4. 同義詞擴充(同義詞替代增長測試資料)

    • 訓練ngram來判斷語句是否通順
    • 提升ngram模型能力
      在這裡插入圖片描述

舉個栗子:
在這裡插入圖片描述

釋出後

  • 線上真實使用者句子
  • 人工標註,反哺測試資料
  • 相似度聚類問法,找出新的問法
    在這裡插入圖片描述

測試驅動開發

  • 總結分析問題(把出錯的樣本逐一分析原因並歸類)
  • 發現規律,解決某一類問題
  • 主動去發現和挖掘問題