1. 程式人生 > >機器學習工程師 - Udacity 癌症檢測深度學習

機器學習工程師 - Udacity 癌症檢測深度學習

1.如果你是態度認真的機器學習工程師,你會花很長時間清洗資料。

2.對網路提前訓練完全不同的事物,比從來沒有訓練過的網路可以得到更好的結果。從某種角度講,神經網路內部形成的特徵,與你訓練的圖片型別無關。

3.敏感性與特異性
敏感性和特異性雖然與查準率和查全率相似,但並不相同。在癌症示例中,敏感性和特異性指:
敏感性:在患有癌症的所有人中,診斷正確的人有多少?
特異性:在未患癌症的所有人中,診斷正確的人有多少?
查準率和查全率的定義如下:
查準率:在被診斷患有癌症的所有人中,多少人確實得了癌症?
查全率:在患有癌症的所有人中,多少人被診斷患有癌症?
從這裡可以看出,敏感性就是查全率,但特異性並不是查準率。

4.假設我們有一個能夠輸出黑色素瘤概率的神經網路。要將它分類為黑色素瘤或者非黑色素瘤,你會選擇哪個值作為閾值?

下圖是我們的模型對一組病變影象所做的預測直方圖,如下所述:

  • 水平軸上的每個點是從 0 到 1 的值 p
  • 在所有值 p 中,我們定位了被分類器預測概率 p 為惡性的所有病變。

在圖中,我們將 0.2、0.5 和 0.8 作為閾值。請注意:

  • 在 0.2 下,我們正確分類了每個惡性病變,但也對許多良性病變進行了進一步檢查。
  • 在 0.5 下,我們未診斷出一些惡性病變(嚴重),對少許良性病變進行了進一步檢查。
  • 在 0.8 下,我們對大部分良性病變進行了正確分類,但未診斷出許多惡性病變(非常嚴重)。

在該模型中,可能會有更好的閾值。這個閾值是0.4。