1. 程式人生 > >AI 系統首次實現真正自主程式設計,完爆初級程式設計師

AI 系統首次實現真正自主程式設計,完爆初級程式設計師

轉自新智元(微訊號:AI_era)

來源:arXiv,編譯:聞菲,常佩琦

【導讀】讓AI自動程式設計是人工智慧領域長久以來的夢想之一。現在,來自彭博和英特爾實驗室的兩位研究人員,號稱實現了首個能夠自動生成完整軟體程式的AI系統“AI Programmer”,這個“AI程式設計師”利用遺傳演算法和圖靈完備語言,開發的程式理論上能夠完成任何型別的任務。AI自動程式設計的時代,大幕已開。

讓AI自動程式設計一直是電腦科學家的夢想。目前這個方面的成果還非常有限,比如讓AI自動補完程式語言,或者執行簡單的加法程式。今天我們要介紹的這項工作,號稱是第一個能夠全自動生成完整軟體程式的機器學習系統“AI Programmer”。 

研究人員表示,他們用這個系統證明了長久以來的假設,那就是功能完備的程式確實能夠被自動生成。具體到這項工作,AI Programmer利用機器學習中的遺傳演算法,模擬複雜的指令。雖然現在AI Programmer生成的程式,複雜程度與人類新手程式設計師編寫的結果相當。但研究人員認為,AI Programmer編寫的程式完全可以超越傳統範疇,不受人類時間和智慧的侷限。

AI編寫的程式只是在測試複雜度和計算資源之間找得到最適合的點。換句話說,可能性無限。

研究人員還表示,我們需要重新思考,設計新的、面向機器的程式語言,因為當前的程式語言是面向人類的,不適用於基於ML的程式設計。“在考慮ML驅動程式生成的未來時,我們需要放棄和重新考慮典型程式語言建立的方法。”

研究人員寫道,只有這樣做,我們才能開始設想一個由AI系統驅動,以人類創造力和設計為指導的計算機軟體開發的新未來。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

AI Programmer的軟體架構。從圖中可見,由人類驅動的部分非常少,只需要在開始輸入指令,最後接收適用於某項任務的函式即可,剩下部分全部由機器完成。

AI Programmer:利用遺傳演算法自動生成程式,理論上能夠完成所有型別的任務

根據論文,研究人員選擇了無型別程式語言,只包括了8種指令來驅動AI Programmer生成軟體。

0?wx_fmt=png

AI Programmer使用的程式語言是圖靈完備的,如表1所示。理論上,在時間和記憶體不限的情況下,圖靈完備程式語言能夠處理任何程式設計任務。本質上,任何一種具有這種特質的程式語言都能夠解決海量程式設計問題。同樣,AI Programmer生成的軟體能夠完成所有任務。


有了這個保障,再來看AI Programmer的核心——遺傳演算法。

要使用遺傳演算法生成軟體程式,必須首先建立一個基因組(genome)。基因組是一組被組合在一起作為單個單元的基因。AI Programmer的基因組編碼為浮點陣列,每個唯一指令的固定值範圍在0和1之間,如上面表1的基因範圍列所示。

建立好基因組後,AI Programmer就將其轉換為相應的程式,執行,並根據程式的輸出為結果程式分配適合度。生成的程式越靠近解決提供的任務,適應度就越高,越有可能繼續進行下一代的進化。在每一代,AI Programmer利用隨機選擇以及交叉和變異來建立子程式,其中包含輕微的隨機擾動,並且可能比其父母更好的基因組來解決目標任務。

0?wx_fmt=png

圖3展示了從浮點陣列中構建基因組的例項。每個值範圍對映到程式語言中的特定指令。最初,這些值是隨機的,導致生成的程式無法正常執行。但是,其中必將有一兩個能夠執行並執行一些有效的指令。一個程式執行得越成功,就越有可能繼續使用程式碼,實現更成功的後代。

0?wx_fmt=png

為了建立後代,父母將其基因的一部分交給孩子,這個過程如圖4所示。除了繼承父母的程式設計指令外,每個孩子也可能會遇到突變,也就是對特定基因增加受控但隨機的擾動。這導致特定基因的值發生修改,使所得到的程式設計指令發生變化,進而改變整個程式。

0?wx_fmt=png

可執行程式根據其執行情況進行排名,如圖5所示。其中,特定程式會被立即從基因組池中刪除,成功的方案則被推進以產生新的後代。

AI Programmer使用結果:輸出“Hello World”,反轉字串,加減乘,輸出斐波那契數列……

AI Programmer由C#.NET設計的模組化框架組成。包括執行遺傳演算法的引擎,基因組編碼器和解碼器,用於執行模擬程式的沙箱解讀器,以及將程式碼轉換為二進位制可執行檔案的編譯程式。雖然最初設計AI Programmer的時候使用C#,但需要注意的是,設計原則並不限於使用C#。

研究人員指出,AI Programmer的適應性測試軟體框架具有延展性,並已被開發。使用者可以自己設計無數的定製化軟體,最終指導系統的遺傳演算法(GA)生成和軟體程式演變。

0?wx_fmt=png

如果目標程式旨在生成一個字串,如”Hello World”(見上圖),測試分數可能是字串中的數字。但由於AI Programmer是在位元組級生成程式碼,測試分數應將輸出字元的增量差考慮在內。

研究人員表示i,他們能用AI Programmer生成很多軟體程式。表2是所生成程式的名單。

0?wx_fmt=png

一開始,研究人員讓AI Programmer生成了一個非常簡單的程式來輸出“hi”。經過5700代後,測試成功。生成程式碼如圖9所示。

0?wx_fmt=png

經過580,900代後,生成了“hello world”,如圖10所示。

0?wx_fmt=png

經過6,057,200代後,AI Programmer成功生成了”I love all humans”,如圖11所示。

0?wx_fmt=png

AI Programmer生成反轉字串的程式。生成程式碼如圖13所示。

0?wx_fmt=png

AI Programmer能在92,400代之後生成加法程式;在177,900代之後生成減法程式,如圖15所示。

0?wx_fmt=png

圖16所示的生成程式可以從兩個初始輸入值來輸出斐波納契序列。

0?wx_fmt=png

論文:AI Programmer,使用遺傳演算法自動建立軟體程式

0?wx_fmt=png

摘要

在本文中,我們介紹了首個能夠自動生成完整軟體程式的機器學習(ML)系統,全程只需最低限度的人類參與。這個系統名叫“AI Programmer”,以遺傳演算法(GA)為核心,加上緊密約束的程式語言,將其ML搜尋空間的開銷降到最低。AI Programmer的新穎部分源於(i)獨特的系統設計,包括用於效率和安全性的嵌入式手工直譯器(hand-crafted interpreter),以及(ii)對遺傳演算法的增強,納入了指令基因(instruction-gene)隨機化繫結,以及程式語言特定的基因組構建及消除技術。我們詳細介紹了AI Programmer的系統設計,詳細介紹了系統的工作原理,以及使用主流CPU來演示其軟體生成功能和效能的實驗資料。

論文地址:https://arxiv.org/pdf/1709.05703.pdf

新智元簡介:人工智慧領域排名第一的社交平臺,專注報道人工智慧領域的前沿資訊、產業分析和技術乾貨

640?wx_fmt=jpeg

●本文編號2659,以後想閱讀這篇文章直接輸入2659即可

●輸入m獲取文章目錄

推薦↓↓↓ 

640?wx_fmt=jpeg

Python程式設計

涵蓋:程式人生、演算法與資料結構、黑客技術與網路安全、大資料技術、前端開發、Java、Python、Web開發、安卓開發、iOS開發、C/C++、.NET、Linux、資料庫、運維等。