1. 程式人生 > >首個應用到大規模真實工業場景的神經網路控制系統在谷歌上線了

首個應用到大規模真實工業場景的神經網路控制系統在谷歌上線了

      即便深度學習和其它機器學習方法近幾年已經取得了不小的發展,但是把它們直接應用在真實工業場景中、讓它們直接控制工業系統還未曾見到。深度學習本身缺乏魯棒性、面對新狀況難以預測行為等一些特性固然是重要的掣肘之處,如何讓演算法逐步提高控制範圍、協調與人類的協作方式也是難題。DeepMind 和谷歌最近就做出了新一步嘗試,取得了不小的成功,然後在 DeepMind 部落格上進行了介紹。

      我們人類社會面對的許多緊迫問題中,有許多問題還在變得越來越複雜,所有人都急切地想要找到好的解決方法。對於 DeepMind 和谷歌來說,他們相信如果人類可以把 AI 作為探尋新知識的工具加以利用,找到解決方法就會容易得多。

     2016 年時,DeepMind 和谷歌聯手開發了一個基於 AI 的動作推薦系統,向負責維護、調節冷卻系統的資料中心運營人員推薦不同狀況下的應對方法,它讓谷歌當時已經具有很高能源效率的推薦系統資料中心向前更進了一步。他們的出發點也很簡單,為了應對全球氣候變化,大型能耗場所的一點點小改進也能在在減少能源消耗、減少二氧化碳排放方面有重大影響。

      最近,DeepMind 把這個系統升級到了一個全新的級別上:不再像原來的系統那樣向人類推薦一些動作,然後由人類去完成,AI 系統現在會直接控制資料中心的冷卻系統,當然了它也仍然受到資料中心運營人員的專業監控。這是首個基於雲的控制系統,已經在多個谷歌的資料中心中安靜地執行、持續地節省能源。

工作方式

     每隔 5 分鐘,這個基於雲的 AI 會從資料中心的數千個感測器中採集資料,獲得資料中心冷卻系統的狀態快照,然後把它輸入深度神經網路。這個網路會預測各種可能的操作的不同組合會如何影響資料中心的能量消耗。然後 AI 就會就會在滿足魯棒安全性限制的條件下判斷出一組能夠最小化能源消耗的動作。這些動作的判斷結果接下來會被髮回給資料中心,由本地的控制系統驗證並執行。

        這種系統執行的想法其實來自於在資料中心使用原來那個 AI 推薦系統的操作人員。他們告訴 DeepMind 的研究人員們,雖然系統給他們教了一些最新最好的操作技巧,比如讓冷卻介質覆蓋更多的裝置,而不是更少,但是實現這些推薦操作其實需要花費非常多的操作精力和長期規劃。所以他們自然地就很想知道,能不能不需要人來出力就達到類似的能源節省效果。

       現在他們就可以很高興地宣佈,答案是能。谷歌的一位資料庫操作人員表示:「我們希望可以節省能源,同時也降低操作人員的工作強度。自動化的系統就可以讓我們以更高的頻率執行更細粒度的行動,同時出的錯誤還更少。

兼顧安全性和可靠性

      谷歌的資料中心裡一般都有上千臺伺服器,它們支撐著谷歌搜尋、Gmail、YouTube 等使用者們每天都會使用的服務。確保這些服務可以可靠、高效地執行是最關鍵的一件事。DeepMind 和谷歌一起設計 AI 智慧體以及背後的控制介面時,都是帶著安全、可靠的思維從頭設計的,還使用了 8 種不同的機制確保系統能夠總是能夠按照預期行動。

      他們使用的方法裡,其中一種較為簡單的是估計不確定性。對於總計上億個可能的動作中的每一種,AI 智慧體都需要計算自己認為這是一個好的動作的信心。估計出來信心太低的動作就不去考慮了。

      另一個方法是兩層驗證。AI 計算出的最優行動首先需要根據一個內建的、由資料中心運營人員們制定的安全限制清單做檢查。計算的結果通過檢查、從雲端傳送到實際的資料中心之後,當地的控制系統還會再次把指令根據自己的一套安全限制清單再檢查一遍。這種冗餘設計的檢查流程確保了系統的執行總是在當地的限制之內的,操作人員們也總是對操作的邊界有完全的控制。

      最重要的是,谷歌的資料中心總是會受到人類的完全控制的,人類隨時可以選擇退出 AI 控制模式。這時候,控制系統會自動從 AI 控制無縫地切換到基於現代自動化工業使用的基於現場規則的以及啟發式設計的控制系統。

      他們設計的其它安全機制如下圖:

          連續監控、自動錯誤重啟、平滑切換、兩層驗證、不間斷通訊、不確定性估計、規則與啟發式設計的備用控制系統、人類指令優先越用越節省能源

      相比於原來的動作推薦系統需要操作人員自己檢查以及實施推薦的動作,新的 AI 控制系統是自己直接實現這些動作的。DeepMind 和谷歌的研究人員在開發它時也有有意識地把系統的優化邊界設定到了一個更窄更小的策略中,讓它把安全和可靠作為首要目標,也就是說對於節約能源的目標來說,它需要在過於節約導致的不穩定風險和優化不足的低反饋之間找到平衡。

      雖然只上線了幾個月時間,這個系統已經可以穩定地節約平均 30% 左右的能源,而且他們還期待系統未來可以改善更多。這是因為隨著資料更多,系統的優化判斷能力也會變得更強,如下圖。隨著技術越來越成熟,DeepMind 和谷歌的研究人員未來也會把系統的優化邊界設定得寬鬆一些,來達到更好的能源節約效果。

      這個 AI 直接控制的系統時不時找到一些新的方法管理冷卻系統,有一些方法甚至讓資料庫操作人員覺得驚訝。與這個系統緊密協作的一位谷歌資料中心運營人員就驚訝道:「這個 AI 會利用冬天外面比較冷的特點,產生比平時更冷的冷卻水,然後減少了給資料中心降溫所需的能源消耗。規則是不會自己變得越來越好的,但是 AI 可以啊。

      對於已經安全執行、獨立執行、降低能耗的 AI 直接控制系統,DeepMind 和谷歌都覺得非常激動。不過,在資料中心中使用這樣的系統才僅僅是個開始。在長遠的未來,他們認為還有很多的潛力把這樣的技術運用在其他工業場景中,也就可以在更大的規模上幫助對抗氣候變化。

 物聯網&整合技術 QQ群:54256083