寫稿機器人“搶”飯碗?數量不斷壯大
全球人工智慧的發展日新月異,AI+工業、AI+醫療、AI+製造業、AI+教育……可謂百花齊放,隨著網際網路的不斷演進,移動智慧終端的高度成熟,資訊“爆炸”時代已悄然來到大眾身邊,在這個海量資訊的背後,衍生了一種新的“媒體人”,它們不是人類,而是“機器人”。
今年10月,廣州國際人工智慧產業研究院正式入駐廣州市南沙區,研究院攜16支人工智慧領域高階人才團隊率先進駐南沙。重點實驗室中,有一支專注於人工智慧和自然語言處理(NLP)在資訊內容領域應用的AI研發團隊——雲天弈,也就是大家早有耳聞的“寫稿機器人”。
智慧機器人除了能下圍棋,還能寫稿?早在2009年,美國棒球大聯盟就首次啟用了智慧機器人StatsMonkey完成了比賽稿件的撰寫,而2015年,國內網際網路企業騰訊上線了寫稿機器人DreamWriter,截至目前該系統已運作近三年時間。人工智慧已慢慢融入當下的內容創作, “寫稿機器人”的“智商”究竟有多高?人工智慧又能為媒體行業帶來怎樣的變化?
未來,隨著物聯網技術的深入發展,在萬物互聯的大背景下,這一領域的專家更對全媒體記者描繪了一個更“科幻”的場景。
文、圖表/廣州日報全媒體記者 文靜(署名除外)
智慧寫稿機器人數量不斷壯大
說起智慧寫稿機器人,最早要追溯到2009年,美國棒球大聯盟首次用智慧機器人StatsMonkey通過統計分析,識別比賽期間的重大事件並總結整體比賽動態,自動編寫了一篇體育報道。
而到了2015年,“寫稿機器人”才在行業中真正爆發,國內外各大媒體開始“試水”寫稿機器人。據瞭解,在國外,《紐約時報》利用Blossomblot系統篩選文章向社交網站等平臺推送;《洛杉磯時報》智慧系統專注處理地震等突發新聞……在國內,2015年騰訊旗下名叫Dreamwriter的寫稿機器人正式上線,釋出了一篇名為《8月CPI漲2% 創12個月新高》的報道。隨後,國內媒體也陸續“嚐鮮”,新華社推出機器人寫稿專案、阿里巴巴聯合第一財經推出“DT稿王”,今日頭條推出了“xiaomingbot”……在內容生產領域,傳統媒體、移動網際網路媒體紛紛跟進這股技術熱潮,試圖將寫稿機器人引用到日益大量的新聞報道、內容生產以及分發的過程中;在技術領域,人工智慧業界越來越多的研究團隊投入到“寫稿機器人”的研發當中。
揭祕寫稿機器人
那麼,“寫稿機器人”是如何“寫”出一篇稿件的?國內AI新聞實驗室雲天弈CEO金利傑博士在接受記者採訪時表示,“寫稿機器人”只是讓外界更容易理解的稱呼,在業內他們更願意將這類人工智慧系統稱為“智慧輔助創作系統”,這也是更為貼切的說法。
以 “小弈寫作”平臺為例,它從海量資訊中迅速提煉內容線索,根據使用者輸入的關鍵詞,一鍵生成文章框架,並從多個維度自動評判內容價值。使用者可以通過“系統熱門話題”列表搜尋當前最熱的新聞話題,一鍵生成相關主題文章;也可以通過輸入關鍵詞,讓“小弈”寫一篇命題作文。
全媒體記者瞭解到,“寫稿機器人”與傳統新聞採寫的模式不同。“寫稿機器人”每天自動“抓取”各類海量資訊,當記者和編輯需要某個新聞內容時,輸入關鍵詞,系統會根據關鍵詞先“抓取”上萬條來自各種渠道的相關資訊,並生成初稿。在“小弈寫作”平臺上,國際資訊方面的活躍資料橫跨兩年,整體更是儲存了大概5~6年的資訊,這也側面反映了寫稿機器人平臺背後擁有的海量資料。事實上,這也是作為人工智慧平臺的必備條件——只有擁有足夠大的資料儲備,機器人才能進行分類和學習,從而構建事件的知識圖譜。
當然,不同的人工智慧平臺有不同的演算法與思路,像雲天弈的AI系統並非完全依靠機器人寫出一篇完整的稿件,“絕大部分稿件都是由編輯進行後期加工和潤色”。
“機器人”主要集中
在體育、財經類新聞報道
騰訊媒體研究院釋出的研究內容指出,“寫稿機器人”總共可分為三類,都依賴自然語言處理技術。第一類是基於模板的寫作,即使用一個文章模板,將資料庫中的結構化資訊(包括具體數字、百分比等)填充進去。第二類是提取後整理,即對包含無用資訊的長自然語言文字進行分析,提取文章中的關鍵資訊,重新組織語言後輸出。第三類是完全依靠機器自動生成,一般是通過訓練語言模型,對語言進行數學建模,然後不使用原始文字,而是通過人工智慧的方式逐句地生成演算法認為“最能夠體現原文含義而且看起來像一句話”的文字。
據瞭解,當下眾多的寫稿機器人,或者說大部分“智慧輔助創作系統”都以第一類模板寫作和提取後整理為主。其較為專注和擅長的寫作領域主要是體育類、財經類和災難類新聞。這幾類新聞的共性在於,其內容大部分都依靠資料“說話”。以NBA賽事新聞為例,大部分構成是比分+隊員的得分表現,也就是資料分析為主的新聞型別。因此,在“機器人”的資料庫裡會有這類新聞的模板。同時,系統通過人工智慧具備的深度學習能力,在撰寫這類新聞的同時,分析記者/編輯是如何處理的,從而得到更大量的資料,建立更多種多樣的模式。
全媒體記者留意到,騰訊Dreamwriter所撰寫的財經類新聞,大部分都是關於某隻股票股價升跌的即時新聞。據Dreamwriter負責人劉康表示,Dreamwriter最初誕生時要解決的最核心的問題是“財經新聞的生產能力滿足不了內容的需求”。
而云天弈的“小弈寫作”是基於廣泛題材的智慧資訊寫作系統,是第二類和第三類的結合,其寫作範圍不侷限於靠資料“說話”的新聞領域。據測算,一個小型的編輯團隊,在“小弈寫作”智慧創作平臺的幫助下,工作效率可以提升五倍,“傳統記者/編輯一天大概可以寫兩篇長篇幅的新聞,而在‘小弈寫作’的配合下,一天可完成十篇左右”。在整個智慧輔助創作過程中,系統不但能幫助選題,還能“生成”與記者/編輯想寫內容的相關度極高的文章框架, 可大幅簡化寫作流程,縮短成稿時間。
今年1月,機器人“小弈”在GET資訊App“上崗”。一般而言,傳統新聞資訊的寫作,編輯的工作量佔80%,機器佔20%。目前GET資訊團隊可以做到機器完成65%,人工完成35%的程度,未來希望能實現機器完成80%,編輯只負責20%。“在我們看來,能完全由機器生產並自動釋出的內容只佔很少部分,因為任何媒體都需要監管和內容稽核。未來,新聞資訊平臺的人力也將主要集中在這部分。然而,降低人力成本、提高時效性也是必然的,例如以往30人團隊完成的工作,現在由10人或更少人的團隊也能完成。”金利傑表示。
據國內大型內容資訊平臺的閱讀量資料統計,在“小弈寫作”的幫助下,GET資訊撰寫的不少新聞的閱讀量能達到幾萬到十幾萬,有的甚至上百萬。
經過訓練能有效提升
“機器”的內容生成能力
眾多網際網路企業、科技研發團隊聚焦寫稿機器人,與近三年來移動端新聞資訊平臺領域蓬勃發展無不有著關係——眾多新聞內容客戶端的出現,意味著每天需要產出海量的新聞內容資訊,且保持著按分鐘計算的更新速度。另一方面,則是網際網路使用者對新聞、新資訊的渴求,如今坐地鐵、坐公交上下班的路上,大家都會在“刷”手機,對內容資訊的需求量更是幾何級數地增加。值得留意是,去年,企鵝智庫對外發布了《未來地圖:2017年中國新媒體趨勢報告》,報告顯示,我國網民平均每天花在閱讀新聞資訊上的時長大約為67分鐘,其中日均超過兩個小時的“重度使用者”佔比達到了14.6%。
如今,國內大型的內容資訊分發平臺都講究“千人千面”——通過大資料、演算法、標籤等方式,讓每個人看到的內容都不盡相同。同樣,“寫稿機器人”也能通過後臺的大資料、機器學習能力,針對每個人進行不同的內容推送。雲天弈如此比喻:“想象一下,寫稿機器人就像漁夫,每天都會’打魚’,它將打回來的魚、蝦、蟹等,通過人工智慧演算法進行分類組合。”由於每個人進入智慧平臺的“入口”不同,需求和撰寫的內容亦不同,因此平臺能“知道”他需要什麼內容、哪方面內容的需求較多。此外,機器為讀者提供的內容是24小時不間斷更新的。
“人工智慧驅動的智慧輔助寫作系統和自動寫作系統經過海量優質內容的訓練,一天能夠生產成百上千篇資訊文章,將大力提升資訊內容的生產效率和時效性。人工智慧技術在傳統資訊內容生命週期運作的部分環節實現了革新。”雲天弈方面如此表示。
討論:
寫稿機器人能代替人類工作?
業界認為更多是輔助功能
在寫稿機器人上線之初,“機器人來搶記者飯碗了”“記者們要哭暈”……一時間引起了科技、媒體業界的高度關注。近幾年來,寫稿機器人會否代替人類成為“新聞報道者”,也一直伴隨著技術的發展愈發激烈。
廣東財經大學人文與傳播學院院長、新聞學博士馬持節表示,先進的技術包括當下的智慧機器人,只是助寫手段,工具價值極強。“工欲善其事,必先利其器”,新聞傳播行業不會消失,只會搭乘先進技術快車,行穩致遠。然而,新聞行業依靠的,必然是善於利用先進技術的媒體工作者,而非技術本身。智慧機器人因為與大資料、雲端計算、AR/VR等前沿技術高度融合,因此具備了極強的資料採集、提取、運算和資訊自組織能力,有助於媒體工作者提高內容生產效率,但同時也強化了媒體競爭。
談到“寫稿機器人”的優勢與劣勢時,他認為,與人相比,智慧機器人內容加工生產的優勢比較明顯,資料量大、資訊點多、生產速度快、計算化生產服務精準、可突破時間、空間的束縛。然而,不足也是非常明顯,例如從資料出發、純客觀視角、“目中無人”、在議程設定、新聞評論、輿論引導等資訊增值方面缺少自如可控的能力。
寫稿機器人亦不可能成為未來媒體的一個分支。人類一直走在利用新技術提高內容生產效率的路上,當下,前沿技術就是智慧機器人,於是智慧機器人被媒體化預設,也是情有可原的,但智慧機器人永遠只能用“它”來指稱,因為是機器,是智慧技術而已,永遠不能成為媒體,而媒體的核心是主觀能動性極強的人。
金利傑博士坦言,研發的初衷是希望利用智慧輔助創作系統,將記者、編輯從新聞報道的一些枯燥、辛苦而重複的工作中解放出來,聚焦於內容創作的核心。
馬持節博士亦強調,新聞工作者的失業不是因為技術的進步,而是行業與時俱進導致的新聞工作者群體自我淘汰的結果,部分不適應變化了的時代要求的記者、編輯,必然不適應變化了的新聞傳播行業,因此,失業者必然會存在。
相關連結:
猝不及防 我國首個AI主播“上崗”
在剛剛舉行的烏鎮世界網際網路大會上,我國網際網路企業搜狗與新華社一同推出了全球首個“AI合成主播”。據瞭解,虛擬主播是以新華社某主持人為原型,不但能夠模仿人的聲音,還能夠模仿人的表情。
據悉,AI合成主播能夠實現高效的新聞播報。使用者只需要輸入新聞文字,它就能夠用和真人一樣的聲音進行播報,並且連脣形、面部表情也與真實的主持人相吻合。
具體操作是由真人主播面對鏡頭錄製一段播報新聞的視訊,“搜狗分身”憑藉這段視訊可以將真人主播的聲音、脣動、表情動作等特徵進行提取,然後通過語音合成、脣形合成、表情合成以及深度學習等技術,“克隆”出與真人主播十分相似的具備新聞播報能力的AI虛擬主播。
據搜狗表示,“搜狗分身”利用旗下的AI能力,從影象表情、聲音語言習慣、邏輯思維等層面對AI進行擬人化訓練,然後“克隆”出人類的AI分身,進而幫助人類提高資訊表達和傳遞的效率。
(文靜)