評論區的AI水軍,你已防不勝防 | Demo可玩
銅靈 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
評論區的AI水軍,可能已經讓你防不勝防了。
科技博主Justin Y就自制一個能自動生成評論的水軍AI,根據油管上視訊的標題,AI能夠生成一連串相關評論。
小哥還將這個應用的Demo和開原始碼放了出來,下載後還能自己感受。
釋出短短一天,這條介紹視訊就在油管收穫了800多條評論,網友評論:你的生成機器人真實得讓人害怕!
輕輕一點,假評論馬上就來。
以假亂真
如果不擺明告訴你這是AI,不仔細看,這枚水軍還有以假亂真的潛質。
語句中夾雜了一絲絲的幽默感,配上常用的表情符號,以假亂真沒有問題。
比如,假定視訊標題為無厘頭風的Thanos and shrek are the same character(滅霸和史萊克是同一個角色),確定,AI馬上生成一連串評論。
從沒聽說過整部電影。
像這樣,我甚至不知道這部電影聽起來是什麼樣的。
一旦滅霸拿下了半個宇宙……
根據題目,AI自動聯想到了電影,並能根據電影話題進行下一步評論。
如果輸入視訊標題為“最糟糕的說唱(官方音樂視訊)”(literally the worst rap [Offical Music Video]),AI水軍將會生成怎樣的評論呢?
即便如此,我真的覺得這個挺搞笑的。
我永遠無法與這個匹敵。
AI水軍看起來還蠻謙虛的。
再來一組例子,如果輸入“博弈論:馬里奧其實是個蜥蜴人”,會發生怎樣的神奇反應?
想象不出在這個世界裡將發生什麼。
最終,這個理論是一個笑話。
我覺得他是製造這個的人。
雖然AI生成的評論有時會出現“大腦洞”,但整體效果還OK,還能從多個不同的角度給出評論。
迴圈神經網路加持
打造這樣一個AI水軍,需要用到哪些方法?
小哥哥表示,從識別視訊標題到生成逼真評論,中間只差一個迴圈神經網路。
通過油管自帶的資料API,可以下載大量的視訊名字和下面的使用者評論,這些資料可以用來的訓練資料。
開始訓練前,記得先清潔資料,不要擔心耗時太長,乾淨的資料對於模型的訓練幫助很大。
小哥哥是用詞嵌入的方法預測評論中的下一個單詞是什麼,並且需要教會模型理解標題表示了什麼含義。
最後,通過迴圈神經網路架構,下一個最有可能出現的片語就確定了。
傳送門
Github地址:
https://github.com/HackerPoet/YouTubeCommenter
如果你是windows的64位系統,還可以 下載Demo 來玩。
下載地址(需要科學前往):
http://t.cn/Eo66Vr0
視訊網站的彈幕,也可能不是人類寫的了。
最後,附上整條視訊: