吳恩達機器學習(十六)機器學習流水線、上限分析
阿新 • • 發佈:2018-11-02
目錄
學習完吳恩達老師機器學習課程的照片OCR,簡單的做個筆記。文中部分描述屬於個人消化後的理解,僅供參考。
如果這篇文章對你有一點小小的幫助,請給個關注喔~我會非常開心的~
0. 前言
在設計機器學習專案的時候,通常會制定一條流水線(資料預處理、特徵提取、...之類),根據流水線完成專案。
在完成專案的時候,通常對其精確率進行優化,可採取上限分析(Ceiling analysis),分析最有可能提高精確率的地方。
1. 流水線
如下圖所示(圖源:吳恩達機器學習),為OCR(光學字元識別)的流水線:
影象 文字識別 字元分割 字元識別
2. 上限分析(Ceiling analysis)
上限分析作用是在於發現流水線中哪個步驟優化以後,會給整個模型帶來最大的優化。
如下圖所示(圖源:吳恩達機器學習):
在上述例子中,整體的精確率為 ,如果人為進行文字識別(將文字識別的精確率提高至 ),則整體精確率為 ,提高了 ,如果繼續人為進行字元分割(將字元分割的精確率提高至
如果這篇文章對你有一點小小的幫助,請給個關注喔~我會非常開心的~