1. 程式人生 > >NLPCC:自然語言處理和中文計算——AI歌詞創作樣本

NLPCC:自然語言處理和中文計算——AI歌詞創作樣本

AI創作歌詞

本文主要介紹小禪在中文自語言處理的一些成果。主要包含中文歌詞的訓練和樣本處理以及歌詞的創作。主要的內容如下:

  • 樣本的收集和處理
  • 最新演算法復現和調參
  • GPU訓練
  • 測試結果
  • 經驗總結

樣本收集和處理

  • 由於本文訓練的是文字生成,所有根據音樂的型別:流行、古典、詩歌、短小說等分為幾大類,由於篇幅的限制本文主要介紹流行音樂的歌詞的生成。
  • 本文收集了14萬行的中文流行歌曲,大約120W字,作為訓練集。

    本文收集的樣本做了如下處理:

    –清除了歌曲名字、作者資訊、所有的符號、以及所有的小於2個字的行樣本

GPU訓練(具體操作需聯絡:QQ260187357)

部分程式碼

程式碼塊語法遵循標準markdown程式碼,例如:

@requires_authorization
def somefunc(param1='', param2=0):
    '''A docstring'''
    if param1 > param2: # interesting
        print 'Greater'
    return (param2 - param1 + 1) or None
class SomeClass:
    pass
>>> message = '''interpreter
... prompt'''

測試樣本

樣本1

我會一直等你

只為了種糾纏

我如何能讓你堅持過

我只是個陪伴

就算愛情只能對你傾心

就算我心裡

我獨自地在這裡等著你

你我的心裡有一個好人看見

我認真的可以不可能

還不要說

若是你做的夢

我們對我說

你猜到嗎

再也沒有選擇的所有

樣本2

能不能就這樣

時間都不能阻擋我奔前程

就在這一瞬間

我們該是什麼

讓我們回到那一秒

我知道你的心

無法擦去的痕跡

這一朵花結婚紗萬年

你是我最愛的人

有時候想要的未來

樣本3

我們的愛情

不要再為了我

我喜歡你

我的眼淚

我也不會再痛

不必要

不管別人怎麼說

我在黑暗的一角靜靜靜等待

我想你

我們都沒有用

QQ交流群

QQ群,歡迎加入群裡有資料