1. 程式人生 > >當AI遇上量子計算:神經網路量子糾錯系統或超越傳統糾錯策略

當AI遇上量子計算:神經網路量子糾錯系統或超越傳統糾錯策略

量子計算機可以解決傳統計算機無法完成的複雜任務。然而,量子態(quantum states)對來自外界的持續干擾極其敏感。研究人員希望使用基於量子糾錯(quantum error correction)的主動保護來解決這個問題。

近日,德國馬克斯·普朗克光學研究所所長Florian Marquardt及其團隊在物理期刊physical review X上發表論文Reinforcement Learning with Neural Networks for Quantum Feedback,提出一種基於人工智慧演算法的量子糾錯系統

2016年,人工智慧程式AlphaGo在圍棋比賽中擊敗了世界上最強的人類棋手,舉世矚目。鑑於一局圍棋中的移動組合比估計的宇宙中的原子的數量更多,它需要的不僅僅是處理能力。相反,AlphaGo利用了人工神經網路,它可以識別視覺模式,甚至能夠學習。與人類不同,AlphaGo能夠在短時間內練習下數十萬局圍棋,最終得以超越最優秀的人類棋手。

馬克斯·普朗克研究所的研究人員正試圖利用這種神經網路為量子計算機開發糾錯學習的系統。

人工神經網路是一種模擬相互連線的神經細胞(神經元)行為的計算機程式——在這項研究中,大約有2000人工神經元相互連線。

“我們從電腦科學中獲取最新的想法,並將其應用到物理系統,”Florian Marquardt說:“這樣,我們可以從快速進步的AI領域獲益。”

ccb859daf50192d675f0dd0c7b8edfc187d7bdec

學習量子糾錯:神經網路在執行任務時,人工神經元活動的視覺化

圖片來源:馬克斯普朗克光學研究所

該研究的主要想法可以概括為一下幾點:

人工神經網路或能夠超過其他糾錯策略

在論文中,該團隊證明了人工神經網路能夠自我學習如何執行一項對未來量子計算機操作至關重要的任務——量子糾錯。甚至通過足夠的訓練,這種方法有望超過其他糾錯策略

為了理解它的工作原理,首先需要了解量子計算機的工作方式。量子資訊的基礎是量子位元(quantum bit,或qubit)。與傳統的數字位元不同,量子位元不僅可以採用0和1兩個態,而且可以採用兩種態的疊加。

在量子計算機的處理器中,甚至有多個量子位元作為聯合態的一部分疊加在一起。這種糾纏讓量子計算機具有解決某些複雜任務的強大處理能力,而這些任務是傳統計算機毫無辦法的。

但是,量子資訊對環境噪聲非常敏感。量子世界的這一特性意味著量子資訊需要定期修正——即量子糾錯。然而,量子糾錯需要的操作不僅複雜,而且必須要保持量子資訊本身的完整。

量子糾錯就像一場規則奇特的圍棋遊戲

Marquardt在介紹該研究的工作原理時提出了一個有趣的類比,他說:“你可以把量子計算機的元素想象成一塊圍棋棋盤

,量子位元像棋子一樣分佈在整個棋盤上。”但是,與傳統的圍棋遊戲相比有一些關鍵的區別:所有棋子都已經排列在棋盤上,而且每一枚棋子都是一面是白色一面黑色。一種顏色對應0,另一種顏色對應1,並且量子圍棋遊戲中的移動相當於將棋子翻過來。根據量子世界的規則,棋子也可以是黑白混合在一起的灰色——代表量子態的疊加和糾纏。

在玩這個量子圍棋遊戲時,玩家——讓我們稱她為Alice——做出的動作是為了保留代表某種量子態的模式。這就是量子糾錯操作。與此同時,她的對手竭盡全力摧毀這種模式。這代表實際的量子位元在其環境中經受的過多幹擾的持續噪聲。此外,量子圍棋遊戲難度特別大,因為還有一條特殊的量子規則:Alice是不允許看到棋盤的。只要一瞥見任何能揭示量子位元狀態的場景,都會摧毀遊戲目前敏感的量子狀態。

問題是:在這麼多限制下,她如何才能做出正確的舉動?

輔助量子位元揭示了量子計算機中的缺陷

在量子計算機中,這個問題是通過在儲存實際量子資訊的量子位元之間定位額外量子位元來解決的。可以採取間斷的測量來監視這些輔助量子位元的狀態,允許量子計算機的控制器識別故障所在的位置,並對這些區域中攜帶資訊的量子位元執行糾錯操作。

在作為類比的量子圍棋遊戲中,輔助量子位元由在實際遊戲棋子之間分佈的輔助棋子來表示。Alice可以偶爾看一眼,但只能看這些輔助棋子。

在這個研究中,Alice的角色由人工神經網路完成。研究人員的想法是,通過訓練,網路將變得非常擅長這個角色,甚至可以超越人類所設計的糾正策略。

然而,當該團隊研究一個包含五個模擬量子位元的例子時,他們發現僅用一個人工神經網路是不夠的。由於網路只能收集關於量子位元狀態的少量資訊,它永遠無法超越隨機試錯的策略。最終,這些嘗試破壞了量子態,而不是糾正它。

一個神經網路使用它的先驗知識來訓練另一個神經網路

解決方案是加一個額外的神經網路,作為第一個網路的教師(teacher)。憑藉其對量子計算機的先驗知識,該教師網路能夠訓練其他網路——也就是它的學生——從而引導網路成功地進行量子糾錯。但是,首先,教師網路本身需要充分了解量子計算機或需要控制的量子計算機元件。

原則上,人工神經網路使用獎勵系統進行訓練。對於量子糾錯系統,要成功恢復原始量子態,實際的獎勵是必要的。

“然而,如果在實現這個長期目標後再給予獎勵,它需要嘗試許多次糾錯,實現目標需要的時間太長,”Marquardt解釋說。

因此,他們開發了一種獎勵系統,即在訓練階段也能激勵教師神經網路採用有效的策略。在量子圍棋遊戲中,這個獎勵系統將為Alice提供給定時間內遊戲的總體狀態,但不洩露細節。

學生網路可以通過自己的行動超越老師

“我們的第一個目標是讓教師網路學會在沒有人工協助的情況下成功地實現量子糾錯操作,”Marquardt說。與學生網路不同,教師網路不僅可以基於測量結果,還可以基於計算機的整體量子狀態來做到這一點。由教師網路訓練的學生網路一開始會變得同樣好,但通過自己的行為,可以變得更好。

除了量子計算機中的糾錯之外,Florian Marquardt還設想了人工智慧的其他應用。在他看來,物理學提供了許多系統,可以受益於人工神經網路的模式識別。


原文釋出時間為:2018-10-30

本文來自雲棲社群合作伙伴新智元,瞭解相關資訊可以關注“AI_era”。

原文連結:當AI遇上量子計算:神經網路量子糾錯系統或超越傳統糾錯策略