1. 程式人生 > >Coursera-吳恩達-機器學習-第六週-測驗-Machine Learning System Design

Coursera-吳恩達-機器學習-第六週-測驗-Machine Learning System Design

說實話,這一次的測驗對我還是有一點難度的,為了刷到100分,刷了7次(哭)。

無奈,第2道和第4道題總是出錯,後來終於找到錯誤的地方,錯誤原因是思維定式,沒有動腦和審題正確。

這兩道題細節會在下面做出講解。

第二題分析:題意問,使用大量的資料,在哪兩種情況時會有好的表現?

B選項,演算法中有很多feature,需要大量的資料進行訓練,故正確。

C選項,feature中有能預測正確的充足的資訊。故正確。

C選項可以理解為,我們可以有很多feature,但是我們需要的是有用的feature(包含了充足的資訊,以致於我們能夠預測正確)。

第四題分析:題意是對垃圾郵件進行分類,有99%不是垃圾郵件(y=0),1%是垃圾郵件(y=1)。

畫出 skewed data 的 error metrics,問題就明朗了。