讓 AI 釋放科研系統的 7 宗罪之一?出版業正在試行 AI 同行評審員,但做決定的仍是人類
2016 年美國數字媒體公司 Vox Media 旗下新聞網站 Vox 發表了一篇調查了 270 名科學家,歸納出科研系統需要解決的 7 宗罪,其中一個就是同行評審,現在人工智慧或許可以幫忙解決這個問題,改善流程,節省審稿人的時間。 Nature 一篇最新文章報道,已經有一些學術出版商正在試行 AI 工具,從選擇評論者、檢查統計資料、到總結論文的發現。
同行評審的目的是在出版前剔除掉低質量的論文,但這個制度難以避免存在問題,比如相當耗時,有些審稿人的評審過程不夠仔細,導致錯誤、有缺陷的論文被出版,以及編輯和審稿人知道作者是誰,作者卻不知道編輯和審稿人是誰,在這審稿過程中是否會有傾向性等爭議。而要怎麼彌補同行評審的不足,行業內也提出一些方式,像是提高透明度、建立工作組的協作同行評審等,人工智慧搭配人類做裁決,則是一種新作法。
利用 NLP 和 ML 來分析手稿
阿姆斯特丹出版業巨頭 Elsevier 的同行評審管理系統 Aries Systems,在今年 6 月採用了名為 StatReviewer 軟體,該軟體會檢查手稿中的統計資料和方法是否合理。此外,許多期刊使用的同行評審平臺 ScholarOne,正在與丹麥的論文及專利線上搜尋平臺 UNSILO 合作,UNSILO 利用自然語言處理(NLP)和機器學習(ML)來分析手稿,通過語義分析自動提出關鍵概念、總結論文內容。

(來源:麻省理工科技評論)
UNSILO 開發的初版工具 是從 PubMed Central 學術資料庫抓取資訊,PubMed Central 可以將新手稿與 170 萬份已釋出的生物醫學研究論文的全文進行比較,為了繼續擴大資訊量,UNSILO 表示,後續很快會增加超過 2000 萬份 PubMed Central 的論文,同時也與知名的資訊資料分析機構科睿唯安(Clarivate Analytics)旗下的 ScholarOne 合作。
另外,UNSILO 也會提出哪些關鍵短語最能代表論點或研究發現,並會標示出這些主張是否與以前發表過的論文類似,讓編輯更快了解研究結果。UNSILO 銷售總監 Neil Christensen 認為,使用語義分析來提取文字的主要陳述,此法通常會比作者提交關鍵字更能清楚地概述論文,但也強調,此工具並不會做出決定,只是告訴人類在比較此篇手稿和已釋出的論文時有哪些突出之處,評審還是人類。
AI 能是人類編輯、審稿人的助手嗎?
“它不會取代編輯的判斷,但可以讓事情變得更容易些”,一家英國出版商的顧問 David Worlock 在德國法蘭克福書展上看到了 UNSILO 示範後,給出了這番評語,但是他同時提出一個值得思考的問題——AI 潛在的陷阱,機器學習工具是根據先前已發表的論文來進行訓練,這樣的決策系統可能會加強同行評審中的現有偏見問題。
目前看來,不太相信 AI 的不只 David Worlock 一人,在英國 eLife 期刊領導創新部門的 Giuliano Maciocci 表示,在想要解決同行評審這個令人頭疼的問題中,UNSILO 提出了有趣的方法,但並不是 eLife 會考慮採用的方案。“我們並不完全相信它在 eLife 這樣的期刊背景下特別有用,因為專家思想非常重要,”他說。

(來源:麻省理工科技評論)
另外,一家被科睿唯安收購、使用機器學習開發同行評審追蹤工具的初創公司 Publons 聯合創始人 Andrew Preston 則直言,演算法還沒聰明到可以讓人類編輯就根據 AI 提出的資訊判斷要接受或拒絕一篇論文,“這些工具可以確保稿件符合要求,但絕不會取代審稿人在評估方面所做的工作,”他說。
檔案自動化的落地不只出版,RPA 商機潛力大
讓 AI 嘗試作為同行評審員的意義在於節省審稿人的時間,由機器做例行性的工作,概念類似於商業環境中的機器人流程自動化(Robotic Process Automation,RPA),在 AI 的應用領域,比起面部識別、自動駕駛等,RPA 或自動化檔案處理不是一個聽起來很性感的領域,但其實商業潛力不小,除了上述的論文檢視、同行評審之外,監管科技(Regtech)更是熱門議題,簡單來說,RPA 就是通過自動化軟體來取代需要大量人力的例行性、高重複性的工作,在金融、法律等領域都有一些實際的落地案例。數日前,日本軟體銀行旗下的軟銀願景基金就投資了 RPA 初創公司 Automation Anywhere 3 億美元。
今年 3 月一家來自以色列、專攻合約審查領域的 AI 初創公司 LawGeex 與斯坦福大學、杜克大學法學院和南加州大學的法學教授合作一項研究,讓 20 名有經驗的律師與經過訓練的法律 AI 程式挑戰,在 4 小時內審查 5 項保密協議(NDA),並確定 30 個法律問題,包括仲裁、賠償等,結果人類律師平均正確率為 85%,AI 則拿下了 94% 的正確率達,而且 AI 只在 26 秒內完成任務,人類律師平均需要 92 分鐘。
但律師不會失業,就像論文審查的決定權力仍在人類審稿人手上,AI 帶來的是改善或加速流程的進行,並抓出人類必須投入大量心力才能抓到的錯誤,訓練有素的 AI 可以在專門、特定的領域達到很好的表現,AI 與專業人士的協同合作,將是未來不可逆的趨勢。