吳恩達機器學習訓練祕籍整理三十三到三十五章（五）

阿新 • • 發佈：2018-11-27

第三十三章

為何與人類表現水平進行對比：

許多機器學習系統的設計目的是想要自動化一些人類可以處理得很好的事情，可舉的例子有影象識別、語音識別以及垃圾郵件分類等等。此外，有許多理由表明在處理人類擅長的任務時，構建機器一個學習系統會更加簡單：

1.易於從人為標籤中獲取資料

2.基於人類直覺進行誤差分析

3.使用人類表現水平來估計最優錯誤率，並設定可達到的“期望錯誤率”。

面臨的難題：

1.很難獲取標籤資料

2.人類的直覺難以依靠

3.最優錯誤率和合理的期望錯誤率難以確定

第三十四章：

如何定義人類表現水平？

如果你的系統目前的誤差為 40%，那麼不論是讓初級醫生（10% 誤差）還是有經驗的醫生（5% 誤差誤）來給你的資料貼上標籤，那都沒有關係。是如果你的系統誤差已經是 10%，那麼將人類表現水平定義為 2% 將為你提供更好的途徑來改進你的系統。

第三十五章：

超越人類表現水平

假設你的系統在處理識別含有噪音的音訊任務時表現已經優於人類，然而在轉錄語速很快的語音時人類仍然佔有優勢。因此在機器已經超越人類水平的問題上，進展通常比較慢，而當機器仍在試圖趕上人類水平時，進展速度反而更快。