1. 程式人生 > >【Kaggle從入門到放棄】(01):競賽型別

【Kaggle從入門到放棄】(01):競賽型別

    Kaggle比賽旨在為參賽人員在機器學習生涯的各個不同階段提供挑戰。因此,競賽型別多樣化。從入門到大神,都可以在Kaggle找到適合自己的競賽。

常見的競賽型別如下,後面有具體的介紹。

a)入門,官方為新手入門準備的三個小專案,有提供答案。

b)遊樂場,新手進階練習專案,提高技能。

c)精選,企業給出的前沿專案比賽,組隊刷比賽,有標準排名

d)研究,大神的世界。

入門

    新手入門級比賽是Kaggle最簡單,最平易近人的比賽。這些是半永久性的比賽,旨在被新使用者用於進入機器學習領域的第一步。他們沒有提供獎品或積分。由於其長期執行性質,入門競賽可能是機器學習中最重要的教程問題 - 它們正是新手開始第一步需要的!

官方為新手入門準備的三個小專案,如下:

a)數字識別器

b)泰坦尼克號:從災難中學習機器學習 - 預測泰坦尼克號上的生還者。

c)住房價格預測:高階迴歸技術

入門專案如圖:

    入門比賽有兩個月的滾動排行榜。提交超過兩個月後,它將失效,不再計入排行榜。這讓新手有機會看到他們的分數如何與一群同水平的新手競爭排名而不是成千上萬的使用者。這對於新手是相當友好的。

    此外,Kaggle學習平臺還為初學者提供了很多教程,從pandas到深度學習。教程被分成各個小模組,幷包含Kernel練習。它們供您訓練建模和學習新技術。您將學習到參加Kaggle比賽所需的所有技能。所以說,這兒不僅提供從人門到大神級的專案比賽,也提供基礎的學習資料。之後,如果利用好Kaggle平臺,在核心裡面你可以找到很多高階的學習資料哦〜

Kaggle學習平臺如圖:

操場

    遊樂場比賽是一種“為了樂趣”的Kaggle比賽型別,難度比入門高出一些。這些比賽通常提供相對簡單的機器學習任務,並且同樣是針對新手設定的,適合那些對小專案有興趣但是。希望在時間投入較低的情況下可以練習新型別問題的Kagglers獎品包括榮譽獎品和小額現金遊樂場比賽的一些例子是:

a)狗與貓 - 建立一種區分狗與貓的演算法

b)葉子分類 - 你能看到葉子的隨機森林(隨機森林)嗎?

c)紐約市計程車行程時間 - 共享程式碼和資料以改善乘車時間預測

如圖所示:

精選

。精選比賽是Kaggle最有名的比賽型別這些都是全面而且難度較高的機器學習挑戰,通常是商業目的的預測問題例如,過去的特色比賽包括:

a)Allstate索賠預測挑戰 - 使用客戶的購物歷史來預測他們購買的保險單

b)Jigsaw毒性評論分類挑戰 - 預測維基百科上有毒評論的存在和型別

c)Zillow獎 - 構建一個機器學習演算法,進行房地產價格評估

如圖所示:

 

精選競賽吸引了一些最強大的專家,並提供高達一百萬美元的獎池。但是,任何人和每個人都可以參加精選競賽。無論您是該領域的專家還是新手,精選競賽都是學習該領域最優秀技能和技術的寶貴機會。

 研究

研究比賽是Kaggle的另一種常見比賽型別。研究競賽的特點是比精選比賽更具實驗性例如,過去的一些研究比賽包括:

a)Google LandmarkRetrieval Challenge - 給定一張影象,您能在資料集中找到所有相同的地標嗎?

b)右鯨識別 - 識別航空照片中瀕臨滅絕的右鯨

c)大規模分層文字分類 - 將維基百科文件分類為約300,000個類別之一

如圖所示:

 

由於研究比賽的實驗性質,研究比賽通常不會提供獎品或積分。但它們提供了一個機會來處理可能沒有乾淨或簡單解決方案的問題,並且這些問題在競爭性稍差的環境中對於特定領域是不可或缺的。