1. 程式人生 > >吳恩達機器學習(十六)機器學習流水線、上限分析

吳恩達機器學習(十六)機器學習流水線、上限分析

目錄

0. 前言

1. 流水線

2. 上限分析(Ceiling analysis)


學習完吳恩達老師機器學習課程的照片OCR,簡單的做個筆記。文中部分描述屬於個人消化後的理解,僅供參考。

如果這篇文章對你有一點小小的幫助,請給個關注喔~我會非常開心的~

0. 前言

在設計機器學習專案的時候,通常會制定一條流水線(資料預處理、特徵提取、...之類),根據流水線完成專案。

在完成專案的時候,通常對其精確率進行優化,可採取上限分析(Ceiling analysis),分析最有可能提高精確率的地方。

1. 流水線

如下圖所示(圖源:吳恩達機器學習),為OCR(光學字元識別)的流水線:

影象 \rightarrow 文字識別 \rightarrow 字元分割 \rightarrow 字元識別

2. 上限分析(Ceiling analysis)

上限分析作用是在於發現流水線中哪個步驟優化以後,會給整個模型帶來最大的優化

如下圖所示(圖源:吳恩達機器學習):

在上述例子中,整體的精確率為 72\% ,如果人為進行文字識別(將文字識別的精確率提高至 100\% ),則整體精確率為 89\% ,提高了 17\% ,如果繼續人為進行字元分割(將字元分割的精確率提高至 100\%

 ),則整體精確率為 90\% ,提高了 1\% ,如果繼續人為進行字元識別(將字元識別的精確率提高至 100\% ),則整體精確率為 100\% ,提高了 10\% 。由此可見,優化文字識別,會給整個模型帶來最大的優化


如果這篇文章對你有一點小小的幫助,請給個關注喔~我會非常開心的~