OpenAI 又搞新動作!新型神經網路模型 MuseNet 讓所有人都能玩轉音樂
今日,OpenAI——由諸多矽谷大亨聯合建立的非營利性人工智慧研究組織——對外發布了一款新型深度神經網路模型 MuseNet,該模型不但可呼叫 10 種不同樂器生成時長約 4 分鐘的音樂作品,而且能夠融合從鄉村到莫扎特再到披頭士等各種音樂風格。
據悉,MuseNet 並非基於我們對音樂的理解進行編曲,而是通過學習預測數十萬 MIDI 檔案中下一個音符,來找到和聲、節奏和曲風的模式。與 GPT-2 相似,MuseNet 同樣採用多功能無監督技術。GPT-2 是一種大規模 transformer 模型,經過訓練即可預測音訊以及文字序列中的下一個音符。
邀你試玩 MuseNet
開啟 MuseNet,進入簡單模式(顯示為預設值),你將聽到該模型預先隨機生成的音樂樣例。然後自行選定一個作曲家或風格,從一段名曲裡選擇一個起始位置,即可開始生成音樂,它允許使用者探索該模型可以建立的各種音樂風格。進入高階模式,使用者則可以與模型直接進行互動,當然這樣一來,一首樂曲會耗費更多的創作時間,但最終卻可以生成一部全新的作品。
MuseNet 所掌握的曲風眾多,因此能讓音樂玩家用新穎的方式將幾代音樂人融合在一起。比如,我們在模型中選取肖邦夜曲的前 6 個音符,並輸入命令,要求生成一個由鋼琴、鼓、貝斯和吉他演奏出的流行音樂作品,MuseNet 最終就能將兩種曲風完美交融,並讓樂隊在 30 秒左右插入。
OpenAI 方面介紹說,在現階段,初版的 MuseNet 曲庫只收錄了部分作曲家,非常歡迎音樂家和普通玩家在 5 月 12 日之前進行免費體驗,也期待看到大家如何用 MuseNet 玩轉音樂,隨後,OpenAI 將根據玩家的反饋對模型進行優化。
作曲家和器樂曲譜寫 token 為音樂玩家賦能
為給使用者賦能,讓使用者能夠更加靈活地控制 MuseNet 生成的樣例,研發團隊還建立了作曲家與器樂曲譜寫 token。在訓練期間,這些作曲家與器樂曲譜寫 token 會被預先新增到每個示例中,因此模型將學會使用這些資訊來預測音符。在樂曲生成時,通過諸如“拉赫瑪尼諾夫鋼琴開頭”這樣的提示符,就可以開始訓練模型根據所選風格來建立樣例了。然後,可通過將 MuseNet 巢狀視覺化,來深入瞭解該模式已經學會了什麼。
初版 MuseNet 尚存兩點侷限性
但 OpenAI 也坦誠,目前這款音樂生成工具只是初具雛形,MuseNet 的侷限性包括:
首先,使用者需要明確一點,對 MuseNet 而言,他們在模型中所選擇的樂器僅僅是建議,而非是一定被滿足的要求。這是因為 MuseNet 生成的每一個音符都是通過對所有音符和樂器的組合概率進行計算方才確定。雖然該模型會盡力調整,以便使使用者所做的樂器選擇成為可能,但這並不能保證它不會做出別的選擇。
另外,當用戶選擇的曲風和樂器組合起來比較古怪時,比如,選擇貝斯和鼓來演繹肖邦,這可就給 MuseNet 出了難題。所以,選擇與作曲家或樂隊原始風格最接近的樂器,模型最後生成的作品才會更加自然。
歷數 OpenAI 的那些研發成果
OpenAI 是一家非營利性人工智慧研究組織,正式成立於 2015 年 12 月,總部位於舊金山。區別於以盈利為目的的傳統企業,OpenAI 致力於將其研究的內容進行開源分享,立足於最大限度造福全人類的目的來發展人工智慧。
回顧這些年,OpenAI 也確實言出必行,研發成果源源不斷。
-
2019 年 4 月,開發出一種深層神經網路 Sparse Transformer,能夠預測序列中接下來將要出現的內容——包括文字、影象以及聲音等。其利用 attention 機制的改進演算法,能夠在相當於以往最大週期的 30 倍的長序列當中提取模式。
-
2019 年 3 月,釋出大型強化深度學習模擬器 Neural MMO,一款”大型多角色”虛擬訓練場景遊戲,把 AI 代理放進一個類似於 RPG(角色扮演遊戲)的模擬場景中,AI 們會互相競爭,通過戰爭來搶奪有限的資源,從而得到優化。
-
2019 年 2 月,建立文字生成器 GPT-2,該自然語言模型經過 40 千兆位元組網際網路文字樣本的訓練,可預測下一個單詞。
-
2018 年 3 月,釋出一種元學習演算法 Reptile。該演算法通過對任務進行重複取樣並執行隨機梯度下降,將初始引數更新為在該任務上學習到的最終引數。OpenAI 官博表示這種方法與 MAML(一種廣泛適用的元學習演算法 )一樣好用,但執行起來更簡單,計算效率更高。
-
2016 年 5 月,釋出開源人工智慧研究工具集 OpenAI Gym 的公開測試版本,該工具集用於開發和對比強化學習(RL)演算法,這是現代機器學習研究的基礎。
但隨著 OpenAI 於上個月在官方部落格宣佈進入重組狀態,成為一家“有限利潤(capped-profit)”的公司,不少業內人士均表示擔心,此舉是否會造成 OpenAI 在未來不再繼續 Open ?也許,只有保持研究成果的持續開源,才能逐步打消人們心中的顧慮。
而本文這款新型深度神經網路模型 MuseNet 的釋出,以及邀請大眾自由參與、免費體驗的開放態度,無疑是繼重組架構風波後,OpenAI“自證清白”的有力一步。
參考連結: