楊強：深度學習、強化學習、遷移學習的結合及應用進展（轉載）

阿新 • • 發佈：2019-01-08

原文地址：

https://blog.csdn.net/happytofly/article/details/80124513

作為首位美國人工智慧協會（AAAI）華人Fellow，唯一AAAI華人Councilor，國際頂級學術會議KDD、IJCAI等大會主席，香港科技大學計算機與工程系主任楊強教授在國內外機器學習界聲譽卓著。在此前接受CSDN採訪時，楊強介紹了他目前的主要工作——致力於一個將深度學習、強化學習和遷移學習有機結合的Reinforcement Transfer Learning（RTL）體系的研究。那麼，這個技術框架對工業界的實際應用有什麼樣的實際意義？在本文中，CSDN結合楊強的另外一個身份——國內人工智慧創業公司第四正規化首席科學家進行解讀。

第四正規化是原百度T10專家、楊強的弟子、遷移學習大牛戴文淵創立的公司，最初的定位是資料量豐富並且業務極為依賴數字化的金融領域，楊強在學術之餘希望推廣人工智慧技術在國內的發展，參與了第四正規化的創業。該公司最近釋出了一個先知平臺，自動化、智慧化的機器學習全流程為一大賣點，核心技術就是RTL。楊強認為，人工智慧成功的五個必要條件包括大資料、問題邊界清晰、外部反饋、計算資源和頂級資料科學家，強化學習和遷移學習分別能夠提供的反饋和適應性是單獨的深度學習模型所不具備的，同時深度學習的重心已經到了從研究轉向工業應用的時候。

參與創業的初衷
CSDN：您之所以參加第四正規化的創業，除了師生關係，還有其他的驅動因素？

楊強：其實我們一直熱衷於一件事：讓我們的技術走向社會。我們一直在研究人工智慧和遷移學習，另外我們也看到了很多大公司的侷限，很多大公司有自己的想法和目標，一個研究者並不能百分之百地發揮自己的想象力，所以我們就想自己做一個有情懷的公司，來支援我們自己做一些想做的事情。一個很好的例子就是Google的Deepmind，他們就是做他們想做的事情，這對我們來說是一個更重要的啟發。

在第四正規化，我的主要工作涉及設計演算法，包括強化學習、遷移學習的演算法，而在工程方面團隊有很多優秀的工程師已經在大公司受過很多的磨鍊，所以我們是互補的。

CSDN：第四正規化公開介紹的核心技術，包括您說到的深度學習、遷移學習、強化學習，還有一個記憶網路，第四正規化的技術體系和您研究的RTL體系是完全一致的嗎？

楊強：是一致的，當然是不是完全使用還看具體場景。我們比較認可的是強化學習、遷移學習，當用不同的結構把它們給組合起來，就是一種很新的好的學習方式。這種方式在現在還不是很流行，我們預計在今後幾年都會用起來，也會通過我們的平臺推動起來。

楊強：深度學習、強化學習、遷移學習的結合及應用進展（轉載）

楊強：深度學習、強化學習、遷移學習的結合及應用進展（轉載）

mathematica的學習及應用題目（二）——函式使用方法提升

常用增強學習實驗環境 II (ViZDoom, Roboschool, TensorFlow Agents, ELF, Coach等) （轉載）

作業系統學習筆記——北京大學陳向群老師課後及習題答案（8）

作業系統學習筆記——北京大學陳向群老師課後及習題答案（3）

作業系統學習筆記——北京大學陳向群老師課後及習題答案（9）

作業系統學習筆記——北京大學陳向群老師課後及習題答案（2）

ONOS：負載均衡路由算法及應用開發（二）

信用風險理論、模型及應用研究（綜述）

CCAI 2017 | 香港科技大學計算機系主任楊強：論深度學習的遷移模型

第二篇：基於深度學習的人臉特徵點檢測 - 資料與方法（轉載）

第一篇：基於深度學習的人臉特徵點檢測 - 背景（轉載）

Oracle學習筆記—Db_name、Db_domain、Global_name、Service_name、Instance_name和Oracle_SID（轉載）

機器學習入門之四：機器學習的方法-神經網絡（轉載）

Python學習：基本數據類型與變量（中）與基礎之條件及循環（上）

[深度學習]實現一個博弈型的AI，從五子棋開始（1）

深度學習解決局部極值和梯度消失問題方法簡析（轉載）

Spring學習（3）：Spring概述（轉載）

Spring學習（3）：IOC基礎（轉載）

【機器學習基本理論】詳解最大似然估計（MLE）、最大後驗概率估計（MAP），以及貝葉斯公式的理解

楊強：深度學習、強化學習、遷移學習的結合及應用進展 （轉載）

相關推薦

楊強：深度學習、強化學習、遷移學習的結合及應用進展（轉載）