1. 程式人生 > >【AI測試】也許這有你想知道的人工智慧 (AI) 測試--第二篇

【AI測試】也許這有你想知道的人工智慧 (AI) 測試--第二篇

概述

此為人工智慧 (AI) 測試第二篇 第一篇連結
第一篇主要介紹了 人工智慧測試、測試什麼、測試資料等。第二篇主要介紹測試用例和測試報告。
之後的文章可能具體介紹如何開展各項測試,以及具體專案舉例如何測試。

測試用例

人工智慧 (AI) 測試 或者說是 演算法測試,主要做的有三件事。

  1. 收集測試資料
    思考需要什麼要的測試資料,測試資料的標註
  2. 跑測試資料
    編寫測試指令碼批量執行
  3. 檢視資料結果
    統計正確和錯誤的個數,檢視錯誤的資料中是否有共同特徵等

而編寫測試用例,主要是圍繞資料來進行。為更好的設計測試用例,首先需要了解一些專案的情況。這些東西如果在《需求文件》中就有描述是最好的。如果沒有需要找演算法工程師溝通了解。

測試用例的思考點
- 專案落地實際使用場景,根據場景思考真實的資料情況,倒推進行測試資料收集
- 模型的訓練資料有多少,訓練資料的分佈情況,訓練資料的標註是否準確
- 演算法的實現方式
- 選擇模型評價指標
- 評價指標的上線要求
- 專案的流程,資料流
- 模型的輸入和輸出
- 演算法外的業務邏輯

測試用例的執行
執行測試指令碼,跑測試資料。
對於一些機器學習的專案的資料,可以通過測試指令碼對演算法執行的結果和測試資料的標註結果進行對比。
對於影象識別類專案的資料,有些標註無法通過數值來量化,還是需要人工來對比。
對於推薦系統類專案,如 多樣性測試,可能也無法通過測試指令碼來對比,需要人工來檢視。

測試結果
通常是統計正確的和錯誤的資料數,使用評價指標的公式計算得出各指標數值。
同時,需要關注錯誤的資料,檢視是否有共同的特徵,再找些這樣的資料單獨來進行驗證,是否帶有此特徵的資料都會識別資料。

測試報告

測試結果最終通過測試報告展現,一份詳見的測試報告,可以讓別人清晰的瞭解測試什麼,怎麼測試的,測試結果是怎麼樣。圖片為自己所寫測試報告,可供參考。
這裡寫圖片描述