開源免費！谷歌用於訓練AI模型的強化學習框架！

阿新 • • 發佈：2018-12-21

強化學習 - 一種人工智慧（AI）技術，使用獎勵（或懲罰）來驅動代理人朝著特定目標前進 - 訓練打敗Alpha Go世界冠軍的系統並掌握Valve的Dota 2.它是Google子公司的核心部分 DeepMind的深度Q-network（DQN），可以在多個工作人員中分配學習，例如，在Atari 2600遊戲中實現“超人”效能。麻煩的是，強化學習框架需要時間來掌握一個目標，往往不太靈活的，而且不是很穩定。

開源免費！谷歌用於訓練AI模型的強化學習框架上線GitHub！

這也就是谷歌提出替代方案的原因：基於TensorFlow的開源強化框架，它是一個機器學習庫。目前，它已經上線Github。

開源免費！谷歌用於訓練AI模型的強化學習框架上線GitHub！

“受到大腦中獎勵動機行為的主要成分之一的啟發，並反映了神經科學與強化學習研究之間強烈的歷史聯絡，該平臺旨在實現可以推動激進發現的那種投機性研究，”Pablo Samuel Castro和 Google Brain Team的研究人員Marc G. Bellemare在一篇博文中寫道。 “這個版本還包括一組闡明如何使用我們框架的colabs。”

他們和Google Brain團隊開發了強化框架，其中考慮了三個原則：靈活性，穩定性和可重複性。

為此，它包括一套精心編寫的程式碼（15個Python檔案），專注於街機學習環境 - 一個用視訊遊戲評估AI技術的平臺 - 以及四種不同的機器學習模型：上述DQN;C51; Rainbow代理的簡化版本; 和隱式分位數網路。為了重現性，程式碼在Arcade學習環境支援的60個遊戲中提供完整的測試覆蓋率和訓練資料（採用JSON和Python pickle格式），並遵循標準化經驗評估結果的最佳實踐。

開源免費！谷歌用於訓練AI模型的強化學習框架上線GitHub！

除了增強框架的釋出，谷歌還推出了一個網站，允許開發人員快速視覺化多個代理的培訓執行。它還提供經過訓練的模型，原始統計日誌和TensorFlow事件檔案，用於TensorBoard繪圖，TensorBoard是Mountain View公司的TensorFlow程式視覺化工具套件。

“我們的希望是，我們的框架的靈活性和易用性將使研究人員能夠嘗試新的思想，包括增量和激進，”Bellemare和Castro寫道。 “我們已經積極地將它用於我們的研究，發現它使我們能夠靈活地快速迭代許多想法。我們很高興看到社群可以幫助做些更偉大的事。“

開源免費！谷歌用於訓練AI模型的強化學習框架上線GitHub！

鑑於TensorFlow目前這麼流行，想要學習和實踐的程式設計師們也可以瞭解下谷歌最近的AI開源專案——AIY Projects。AIY 全稱是 Artificial Intelligence Yourself，顧名思義就是利用 AI 來進行的 DIY 功能套件。谷歌目前為 AIY Projects 推出了兩款硬體--AIY Voice Kit 和 AIY Vision Kit。其中， Vision Kit（視覺套件）附帶的軟體可執行三個基於TensorFlow的神經網路，可以處理影象識別和計算機視覺, 支援離線識別上千種常見物體（動物、植物）以及人臉、面部表情等。

開源免費！谷歌用於訓練AI模型的強化學習框架上線GitHub！

谷歌為此還發布了一個TensorFlow.js的工具，有了這項工具，即使不是機器視覺領域的專家，大家也可以實現很多應用場景，比如在瀏覽器中訓練自己的寵物臉辨識系統，在自家的監視系統中使用等等。

開源免費！谷歌用於訓練AI模型的強化學習框架！

開源免費！谷歌用於訓練AI模型的強化學習框架！

李飛飛確認將離職！谷歌雲AI總帥換人，卡耐基·梅隆老教授接棒

福布斯釋出全球50位科技女性，谷歌前任首席AI科學家李飛飛上榜！

使用谷歌CoLaboratory訓練神經網絡

谷歌最強NLP模型BERT如約開源，12小時GitHub標星破1500，即將支援中文

以太坊已經融入谷歌的血液！谷歌CEO Sundar Pichai和創始人Sergey Brin的兒子都是以太坊礦工

多事之秋！谷歌雲高層人事頻繁變動，CEO也將離職

三攝正普及，四攝在路上？谷歌逆天AI演算法，只做單攝虛化

號外！谷歌宣佈封停Google+，50萬用戶資訊洩露

真正免費的谷歌衛星地圖下載器

華為開源能力中心杜玉傑——開源縱橫談：谷歌與開源那些事兒

Google Colab 免費的谷歌GPU for deep learning

人物故事 | 李飛飛離職谷歌背後：AI還很稚嫩作為科學家很卑微

一個神經網路學習一切！谷歌又放了個大衛星(附論文)

如何免費下載谷歌地球瓦片拼接成大圖

select 標籤預設樣式在火狐和ie瀏覽器上下拉箭頭難看！谷歌ok！在網上找到的解決下拉箭頭的樣式

人人可以機器學習！谷歌教你零程式設計基礎玩轉機器學習 ‖ github+教程

免費試用谷歌的翻譯介面

MIT與谷歌專家合著論文：機器學習和神經科學的相互啟發與融合

谷歌新一代WaveNet ：深度學習怎麼生成語音？ | 2分鐘論文

開源免費！谷歌用於訓練AI模型的強化學習框架！

相關推薦