機器學習領域華人專家最多的前十所機構有哪些?
AMiner的AI華人智庫是對照NSFC的人工智慧專項程式碼F06,梳理出的人工智慧領域的知名華人學者庫,目前智庫裡已經收集了近1800位活躍在領域一線的華人專家學者。
該智庫下有7個一級子領域和62個二級子領域,機器學習領域是其中一個一級子領域。機器學習已經成為了當今時代的熱門話題,但是從機器學習這個概念誕生到機器學習技術的普遍應用經過了漫長的過程。
機器學習概念。普遍認為,機器學習(Machine Learning,常簡稱為ML)的處理系統和演算法主要通過在資料和通過找出資料裡隱藏的模式進而做出預測的識別模式,它是人工智慧(Artificial Intelligence,常簡稱為AI)的一個重要子領域,而人工智慧又與更廣泛的資料探勘(Data Mining,常簡稱為DM)和知識發現(Knowledge Discovery in Database,常簡稱為KDD)領域相交叉。
機器學習發展歷程
機器學習的發展。機器學習已經成為了當今時代的熱門話題,但是從機器學習這個概念誕生到機器學習技術的普遍應用經過了漫長的過程。
機器學習的論文解讀。AMiner選取最近10年表1展示的頂級學術會議知識圖譜領域全部論文作為備選池,在確定細分領域關鍵詞後根據關鍵詞進行細分領域論文的二次抓取。
機器學習的應用領域。機器學習是人工智慧的核心,應用遍及人工智慧的各個領域,目前機器學習已經在資料探勘、計算機視覺、自然語言處理、生物特徵識別、搜尋引擎、DNA序列測序、戰略遊戲和機器人等多個方面都得到了運用。
我們對此華人智庫中的機器學習領域專家資訊進行了統計。
自然語言處理華人專家分佈地圖
我們對機器學習華人專家分佈進行分析,繪製機器學習華人專家分佈地圖。由上圖可知,機器學習華人專家主要集中在北京這種科研院校集中的城市,其次在上海、南京、武漢、哈爾濱和西安等具有機器學習基礎的地區也聚集了許多華人專家。
機器學習在國內企業的應用
百度大腦
百度大腦的四大功能,分別是語音、影象,自然語言處理和使用者畫像這四大能力:
-
語音的能力:包括語音識別能力和語音合成能力。
-
影象的能力:影象能力指的是看到一個圖片,不僅能看得見,還能看得懂。按照技術界的說法,它應該是計算機視覺。
-
自然語言處理能力: 自然語言處理能力比語音和影象更難。語音和影象技術更多還處在認知的階段,而自然語言理解除了要有認知能力之外,還需要邏輯推理能力、規劃能力等等,同時也需要依賴於更為強大的知識圖譜。
-
使用者畫像:使用者畫像在傳統的AI中並不是主流。但是今天,我們每時每刻都可以收集很多很多和使用者行為相關的資料,就可以對使用者做很好的畫像,而這裡面使用的技術又基本上都是與人工智慧相關的。
騰訊AI Lab
騰訊AI Lab成立於2016年,團隊主要分佈在在深圳、西雅圖和北京。騰訊AI Lab研究主攻四個方向,包括機器學習、計算機視覺、語音識別與自然語言處理;應用也主要是四個方向,包括社交、內容、遊戲和平臺型AI+X。
-
2017年3月19日,騰訊人工智慧實驗室AI Lab研發的圍棋AI程式“絕藝”在第十屆日本UEC杯計算機圍棋大賽中奪冠,成為當時國內AI界討論的熱點。
-
2019年1月3日,騰訊AI Lab主任張潼,機器學習、大資料分析領域的國際知名學者,美國新澤西州立大學統計系教授,曾任百度研究院副院長,從騰訊AI Lab離職,由張正友接任。
機構分佈
我們以華人專家庫機器學習領域中的學者的資訊為基礎資料,對其所屬機構進行分類,統計後發現華人專家庫機器學習領域中的學者主要集中在中科院、清華大學、北京大學、南京大學、復旦大學、上海交通大學、東南大學、華中科技大學、哈爾冰工業大學、和國防科技大學等高校。
性別分析
華人專家庫機器學習領域中的學者有96%是男性,4%是女性。