1. 程式人生 > >不安分的程式設計師!阿里90後員工做了個隨時FreeStyle的人工智慧

不安分的程式設計師!阿里90後員工做了個隨時FreeStyle的人工智慧

頂著鴨舌帽、戴著墨鏡,掛著大金鍊子唱著自己寫的rap,這對於從來沒有玩過音樂,甚至五音不全的90後程序員蘆陽來說,看上去是個非常遙遠的夢。

不過最近,他真的在阿里電臺和朋友錄製了人生第一首rap,主題就是關於雙11和人工智慧。幫助他完成心願的,是他自己設計的人工智慧MusicGo。

這個能自己寫rap的人工智慧MusicGo,只要給一個關鍵詞,就能隨時隨地出來一段兒押韻的FreeStyle。

一個五音不全的程式設計師要“唱”rap

在這個夏天之前,蘆陽對rap的瞭解幾乎為零,他對自己的定位甚至是五音不全,會迷上嘻哈,純屬一次跟風的巧合。

《中國有嘻哈》開播後,成為同事們閒聊的話題,平時對綜藝節目關注很少的蘆陽為了“能跟得上同事聊天”才去看節目,沒想到竟然入了迷。“我的工作地點在北京,但是今年常常來杭州出差。因此有很長時間是在路上,於是我就利用出差路上和每天上下班路上的時間刷這個節目,結果越看越喜歡,反覆看了好幾遍。”蘆陽說,在看節目的同時,也瞭解了flow、punchline,以及酷炫的雙押、三押等很多專業詞彙。

蘆陽是《中國有嘻哈》的忠實粉絲,嘻哈這種另類的音樂形式,歌手肆意灑脫的態度,他們反覆強調的keep real精神,都深深吸引著他

看得越多,蘆陽身上程式設計師不安分的基因開始躁動,對rap進行資料分析的慾望就越來越強烈,“我尤其對押韻感興趣。我在想,如果我把嘻哈歌手唱的所有押韻的詞彙都拿下來,然後只要給一個關鍵詞,就能來一段兒FreeStyle,是不是很酷炫。”

於是,他利用業餘時間編寫的一個名為MusicGo的人工智慧,試圖讓MusicGo自己寫rap:

他先把網上有“嘻哈”標籤的歌單都找到,把歌單裡的歌曲都調取出來後,再去掉重複的歌曲。然後依次對所歌單中歌曲頁面進行“爬取”,得到全部詳細歌曲清單。這樣總共爬取了10000多首歌曲。接下來,根據歌曲清單,經過幾個小時,通過呼叫歌詞API得到10000多首歌詞。

接下來,蘆陽用演算法將歌曲分詞,例如“我愛北京天安門”就要分為“我愛”“北京”“天安門”,再把每一組拼音拆分開,例如“天安門”變為“Tian-an-men”。

“這樣所有歌曲的詞、詞出現的次數(詞頻),以及詞對應的拼音都有了。有了拼音之後就是要考慮韻腳了。”蘆陽經過觀察,發現可以用 “a-e-i-o-u” 作為字的分界,取當前以及後面的部分為韻腳。

於是,蘆陽就借鑑《中國有嘻哈》中自己最喜歡的PG One的“炒麵”FreeStyle,嘗試搜了“炒飯”的韻腳,出現了一系列相關的詞彙。“這些詞都是和炒飯押韻的,我再用這些詞嘗試寫rap,二十分鐘就寫了一段雙押19次的rap了。”

這篇原本只在技術論壇的文章很快被運營推上了首屏,當天就得到200多個點贊和1000多條瀏覽。

“喂”了智慧文章才“吐”出科技感歌詞

不過,讓MusicGo利用演算法寫出與設定主題押韻的歌詞,然後自己再做替換,只能算是半自動,這還不是蘆陽的終極目標。

“今年雙11的主題是人工智慧,更多的是人與機器的合作。我想了想,覺得挺酷的。酷就是第一生產力嘛,我就想讓人工智慧寫一首關於雙11的rap。”蘆陽說。

蘆陽加入菜鳥也才僅僅四個月,這是他第一次參加雙11備戰

於是,他又重新改進了MusicGo。改進後的MusicGo獨特之處在於,它並不是依靠開發者手動輸入千百種音程關係與節奏型來進行創作,其核心技能在於“機器學習”。

只需將幾千上萬首完整的音樂作品輸入這個系統,人工智慧MusicGo就會自行“學習”各種rap的規律和方式(資料),從而建立一個可以創作的“神經元網路”。

當蘆陽通過電腦鍵盤輸入關鍵詞之後,它會在神經元網路中尋找並識別類似的歌詞、旋律和節奏。

機器學習的本質在於,它是從資料的角度理解“節奏“和“保持調性一致”等音樂概念,而非從聲音的角度去理解它。

“‘學習’了一句歌詞後,它能‘再造’出另一句歌詞,這樣一來,我只要再調整一些韻腳,整首歌的歌詞就相對完整了。“蘆陽說。

MusicGo的採用了機器學習技術,也就是說,人給機器“餵養”什麼內容,機器就自動學習什麼內容。要產出一個雙11和人工智慧的歌,就要“餵養”很多科技感的內容,於是蘆陽從網上搜索了幾百篇與雙11、智慧、阿里雲、菜鳥等相關的文章,餵給MusicGo。果然有成效,MusicGo“吐”出來的歌詞內容是富有科技智慧感的。

於是,他把想要的節奏、模式先設定好,再輸入“雙11”的主題,按照先前同樣的套路,一段歌詞就這樣“秒級”生成了。蘆陽又用了20幾分鐘的時間修改了韻腳,完成了這首《天貓雙11有嘻哈》的RAP,蘆陽把歌詞放到內網上,立刻有志同道合的同事前來傾情合唱。

《天貓雙11有嘻哈》

蘆陽說,雖然MusicGo現在還不能完全智慧化,但是人工智慧能做的事情已經越來越多。事實上,包含語音識別、影象識別、人臉識別、語音合成、自然語言理解、機器學習在內的阿里雲人工智慧技術已經應用到交通預測、智慧客服、法庭速記、氣象預測等領域。

“現在可以寫歌詞,未來說不定可以自己寫個‘女票’。”這個大男孩最後還不忘幽默一把。