1. 程式人生 > >機器學習心得(一)

機器學習心得(一)

學習或專研一樣東西真的需要常年累月的積累,很久沒寫部落格了,以後堅持記錄,督促進步。

學了一年多的機器學習,講真是在東邊學一點,西邊湊一點。從機器學習演算法,到NLP,輿情,影象處理,神級網路,似乎都瞭解了一下,但是也都不怎麼熟悉。回想看來還是得一項一項,圍繞專題與演算法研究來學習,才能有實質的進步。程式設計必不可少,程式設計的過程能思考很多實施上的問題,也能加深對演算法的理解和調參的理解。

機器學習的步驟:

資料的蒐集:dataFramework的能力很強大,分組,去重,fillnan,需要好好掌握。

分佈觀察,特徵工程:seaborn必不可少,檢視分佈的神器。熱力圖不必說,先選特徵吧。資料量大的時候真心傷不起

資料轉換:onehot編碼,資料歸一化,好吧,暫時用的手段很少,還是要做一個工具包。onehot真難搞,屬性*資料太多會記憶體錯誤。大資料量的運作麻煩啊。onthot也不是必須的,決策樹型別的就不必。

調參:講真,模型調參是個麻煩的事情。不同模型的調參不是隨便搞得,初始值與範圍其實根據模型的特徵和資料的屬性上就可以有一個初步的判斷,需要加深模型理解。大資料量調模型很慢,先縮小,進行模型的初步調參,然後再到大資料量最好。

實施過程:先想好過程吧,總結一套自己的流程,不然總是返工,很浪費時間。機器學習的卻是經驗很重要的學科,對於專題的研究必不可少。

加油,保持更新。