1. 程式人生 > >百度PaddlePaddle常規賽NLP賽道火熱開啟

百度PaddlePaddle常規賽NLP賽道火熱開啟

作為人工智慧時代的基礎,深度學習一直是人工智慧最熱門、企業投入最多的研究領域之一,百度PaddlePaddle深度學習框架應運而生,這是國內唯一一家擁有自主智慧財產權的開源深度學習框架。在此框架中,匯聚了更多的AI科學家、架構師、AI愛好者,設定常規賽,提供豐富的真實資料,多樣的演算法賽題,顯示百度對深度學習框架戰略地位的重視,讓AI愛好者能夠得到更多真實場景的練習機會和更多PaddlePaddle的實際訓練經驗,這勢必推動PaddlePaddle更廣泛、更深入地用於人工智慧研發及落地應用。

目前已推出2個賽題,從最常見的文件提取歸納總結出發,涉及汽車以及中文閱讀領域,無論是從賽事的設計理念,還是對技術能力的把握,此次常規賽都將對PaddlePaddle的推廣和使用產生深遠的影響。之後PaddlePaddle將會持續推出更多主題的常規賽,讓我們拭目以待。

賽題一:汽車大師問答模型賽

【賽題簡介】

汽車大師是一款通過線上諮詢問答為車主解決用車問題的APP,致力於做車主身邊靠譜的用車顧問,車主通過汽車大師用語音、文字或圖片釋出汽車問題,系統為其匹配專業技師提供及時有效的諮詢服務。由於平臺使用者基數眾多,重複回答和持續時間長的多輪問詢花去汽修技師大量時間,也使使用者獲取解決方案的時間變長,對雙方來說都存在資源浪費的情況。為了節省更多人工時間,提高使用者獲取回答和解決方案的效率,要求選手們使用汽車大師提供的11萬條技師與使用者的多輪對話與診斷建議報告資料建立模型,從而可基於對話文字、使用者問題、車型與車系,輸出包含摘要與推斷的報告文字,考驗模型的歸納總結與推斷能力。

賽題二:NLP智慧問答賽

【賽題簡介】

BROAD中包含著迄今為止規模最大的中文公開領域閱讀理解資料集,DuReader。該資料集基於真實應用需求,所有問題均來源於百度搜索使用者的真實問題,文件來自全網真實取樣的網頁文件和百度知道 UGC 文件,答案基於問題與文件由人工撰寫生成。資料集標註了問題型別、實體和觀點等豐富資訊,彌補了現有主流資料集對於觀點類問題覆蓋不足的問題。要求選手們依據BROAD開放資料集中全球最大中文閱讀理解資料集建立基於文字與問題,輸出正確答案的模型,考驗模型的歸納總結與改述能力。

賽程及獎項設定

比賽從2018年9月28日開始,直到賽題下線。常規賽不設初賽複賽,以當月每位參賽選手提交的最優成績排名。這期間選手每天可提交5次作品,當評分優於baseline Model成績,則認定挑戰成功,即可停止提交。選手可同時參加多場比賽。

PaddlePaddle期待與全球AI愛好者們一起打造世界頂級深度學習框架,共同推動AI技術的進步。