連美女主播都是機器人了,新聞業會成為AI的天下嗎
全文共 3437 字,預計學習時長 7 分鐘
人工智慧逐漸滲入新聞業,新聞報道和新聞消費的方式將發生重大變化。

由Luka Lavrenci繪製
在傳統新聞業,經驗老道的編輯挑選重要的新資訊,然後把這些資訊傳達給讀者。那麼,在加深讀者原有的興趣和觀點方面,人工智慧擬人化趨勢能否走得更遠?
如果你是新華社的觀眾,你可能已經注意到,三月份在電視上發生了一些奇怪的事情。
在第十三屆全國人大二次會議期間,播音員新小萌報道了一則有關人大代表已搭乘火車抵達目的地的新聞。新小萌其實是一個超現實的計算機生成模型,能夠機器學習模模擬實新聞播報員的面部表情和演講模式。

新小萌是新華社AI新聞主播生力軍中的一員,他可以準確地播報輸入的資訊,不會疲憊,不會犯錯,也不會抗議。
“在播音員短缺的現狀下,機器人主播似乎充滿吸引力。”
現在,因為此係統僅限於將文字轉化為語音,新小萌的播報內容由人類書寫。要真正理解人工智慧正在如何改變新聞業,你需要了解螢幕背後的執行規則。
自動播音
今年1月,《衛報》釋出了一篇有關澳大利亞政治捐款的文章,署名為ReporterMate。《衛報》稱,ReporterMate是一種“試驗性自動新聞報道系統”,可以通過分析已有資料迅速寫出對應的短訊。該系統的設計者Nick Evershed認為,“新聞機構員工不足,但需要處理的新聞很多”,而人工智慧主播可以幫助處理模式化的新聞,人們從而可以得到更多時間去進行有意義的調查。
據皮尤研究中心稱,在美國,新聞編輯室的僱員數量從2008年到2017年已經下降了45%。而在年初,眾多電子新聞報刊,包括BuzzFeed和Vice,員工缺口超過2000。因此,機器人主播非常有吸引力,它可以整合資料,釋出常規報道,而同時其他人類員工可以把技能用在編寫更加複雜的故事上。
“它們不只是做職業記者通常會做的事情,還有能力比他們做更多的事情——至少稿件數量更多。”
但人工智慧的吸引力不只在填補工作空缺。《華盛頓郵報》的戰略方案主管Jeremy Gilber說道:“我們可以創造一些沒有人工智慧我們可能不會去寫的故事。”過去幾年,《華盛頓郵報》內部也使用了一種叫作Heliograf的自動化技術。在2016年裡約奧運會上,Heliograf生成了數百條有關奧運會的短報。在2016年美國大選期間,它報道了將近500條競選訊息。
Heliograf不只是報道幾條政治競選的預測新聞,而是讓其中一家新聞機構報道絕大多數有關政治競選的新聞。在2014年,美聯社也開始使用人工智慧撰寫金融新聞。在此期間,公司收益報告數值增長了十倍,而這個數值足以影響到金融市場上的貿易交易量。通過使用一種不同的系統,美聯社能夠很快匯出關於1250個北美職業冰球聯賽專案的預測。Heliograf不只是進行職業記者通常會做的事情,而有能力比他們做更多的事情——至少在稿件數量上。
演算法內容管理
處理機器生成的資料蔓延,使其更好服務於讀者會比較複雜。為了避免首頁充斥數百篇有關政治競選的文章,在2018年美國中期選舉期間,《華盛頓郵報》使用網際網路定位技術向用戶提供相關的新聞。比如說,如果你在賓夕法尼亞州,該網站就會讓人工智慧生成與你當地相關的競選報道。
Gilbert說,“重點不在於給很多人寫一篇報道,而在於從很多報道中找出不同的人所適合的那篇。理想情況下,我們想要創造一種平臺,在上面有你願意分享的資訊,並且我們可以提供給你一些你可能感興趣而其他人不感興趣的文章。”
路透社執行編輯Reg Chua也對此持有相似看法,他說,“我們始終堅持將寫的內容發給儘可能多的人看。這很像是同時面向所有人的傳播,這種傳播方式需要更加精彩的故事才能足夠吸引到儘可能多的讀者。”
但是,Req Chua又問道,如果新聞機構的報道覆蓋面太廣,使得這個模式反而本末倒置了呢?“我寫的是一篇關於英國學校和運作的文章,但是讀者實際想要了解的是他們小孩在學校表現如何。那麼我可以將人工智慧和自動化相結合,這樣你就可以獲得一篇專屬的文章了。”
體育比分、政治結果、放假和學校表現報告都是無足輕重的領域,人工智慧可以編造數百篇微觀報告並將其傳送給目標人群。在傳統新聞業,經驗老道的編輯挑選重要的新資訊,然後把這些資訊傳達給讀者。那麼,在增進讀者現有的興趣和觀點方面,人工智慧擬人化趨勢能否走得更遠?
英國資料科學和人工智慧國家研究院——艾倫圖靈研究所資料倫理研究員Josh Cowls警告道,“對讀者個人興趣和偏好的表現進行細微調整後的內容,即使只在一種出版物內釋出,仍可能會產生回聲室效應。” Cowls說在油管可以看到類似情況,油管的推薦服務由於給人們推薦極端內容而備受指責。“你可能會加深人們本身的想法。閱讀新聞的偏好會帶來你已經看過的,從而使得你的選擇越來越少。”
摺紙新聞
人工智慧使文章推送物件的選擇變得更加複雜,同時也在決定個人故事中顯示何種資訊中發揮著決定性作用。《華盛頓郵報》的Gilbert稱,令他感興趣的是機器智慧是如何在對讀者已有了解的基礎上去改變文章的結構的。
他以目前委內瑞拉國內爭端為例,說道,“對於一些人來講,我們只需要告訴他們馬杜羅做了什麼,或者是救援卡車是否已經跨越邊境。因為他們一直在追蹤這個事情,所以新資訊很重要。而另一方面,對於一些沒有持續關注這個事情的人,我們需要告訴他們事情牽涉到的各方,發生的原因以及時間。”
如果你試著把網上文章看作一張摺紙而不是資料點,那麼這張摺紙露出哪一部分取決於是誰在閱讀這篇文章。在這種情況下,人工智慧成為了編輯,重新編輯文章使其適合不同的人群。Gilbert說,這種情況無疑改變了記者、編輯、新聞和受眾群之間的關係。
但是這四者的關係是否因此而變得更好了呢?人工智慧擬人化幫助節約讀者時間與失控混淆視聽之間的界限在哪? Cowls認為,輸入系統資料將受眾群和新聞本身看得一樣重要,這會帶來道德問題。在法律上,它獲取了個人資訊;在道德倫理層面,它牽扯到了身份和偏好問題。
為不同人提供不同閱讀內容——“對傳統新聞編輯道德的真正挑戰。”
對於演算法而言,向讀者展示哪個版本的故事取決於讀者對這個話題了解多少。儘管演算法可以通過讀者瀏覽的歷史記錄來獲取相關資訊,但是這會牽扯到此行為是否和資料收集法相一致。歐洲的《通用資料保護法》對於公司如何使用個人資訊有嚴格的規定。更通俗來講,新聞在構建讀者知識世界上可以做到何種程度?有一個積極應對的方法是詢問讀者感興趣的閱讀內容,從而向他們推薦相似的故事。許多媒體公司已經採用了此方法,包括Medium。也有一種可能就是媒體公司在讀者沒有察覺的情況下,使用機器學習被動地瞭解讀者興趣。但同樣,資訊使用和公眾言論使他們進入困境。
路透社新聞業研究高階研究員Lucas Graves贊同根據不同人提供不同閱讀內容是對傳統新聞編輯道德的真正挑戰。今天的編輯們以專業視角來安排新聞的佈局,所以把決定權交給電腦會使得新聞編輯室與以往完全不同。
機器調查
毫無疑問,機器學習最具潛力的部分並不是面向受眾的新聞業,而是挖掘出可供職業記者研究的故事。
路透社研製出了一批新聞收集人工智慧系統,包括News Tracer——該系統用演算法掃描大批討論同樣事件的推特來挖掘爆炸新聞。其驗證資訊是否可靠的手段包括推特賬號是否通過驗證,賬號的關注者,是否有相關媒體和推文的結構。
另外一個路透社專案——Lynx Insights,可以搜尋類似於股票和體育成績的大資料,標記資料趨勢和異常,甚至會在將其轉交給職業記者前寫幾句話。和機器人記者相比,Lynx Insights更像一個記者的個人資料研究員。這種方法類似於BuzzFeed訓練演算法篩選飛行資料以識別間諜飛機,以及ProPublica使用機器學習來研究成千上萬條新聞稿來分析國會談論內容。
路透社記者Chua說道,“人工智慧最大的用處可能在於分析資料。在未來你可以看到這些功能是如何相互結合的。你可以自動分析人工智慧系統內的資料,然後再自動將其變成一個故事。”
這些自動化的環節最終互相聯結是大勢所趨。類似路透社的Lynx Insights的系統可以自動找到一個潛在故事,將這些資訊提供給《衛報》的ReporterMate進行編寫,然後將這樣的故事交給像新小萌這樣的機器人新聞播報員在電視直播上播報,整個過程都不需要人類的存在。
Cowl說:“這個過程的機械化程度越高,我們的疑問也越多‘等下,附加值是什麼?’如果我們要做的只是收集事實並將他們傳播出去,那麼編輯的附加值是什麼呢?這種想法很危險……你可能最終會陷入困境,覺得在這個過程中,整個刊物乃至故事的真實性降低了。”
好在這種反烏托邦的新聞自動水平幾乎不會發生。Chua和Gilbert都承認我們正處在人工智慧適應新聞業的早期階段,而這項技術尚未成熟,僅僅是內容最為豐富的資料集而已。《衛報》記者Evershed稱,在一段時間內,我們仍然需要記者。
就算我們實際並不在探討機器人播報員自動播報新聞這件事情,但我們仍需謹慎行事。考慮到人工智慧系統製造的資訊仍然作為故事可信度中的一部分,不管其製造的是背景資訊,話語本身,或者是找到的讀者,我們都應該時刻重點關注這些機器製造的新聞。畢竟,讀者是人類。

留言 點贊 關注
我們一起分享AI學習與發展的乾貨
歡迎關注全平臺AI垂類自媒體 “讀芯術”