我們仍處於法律AI的“史前時代”
導語:法律AI當下最真實的模樣你瞭解嗎?2018年9月12日,華宇元典法律研究院公訴業務專家葉衍豔受邀赴華東政法大學參加PLUS演說會。本場專題演說會由上海司法智庫學會青年法研社與華東政法大學“網際網路+法律”大資料平臺聯合主辦,本文根據葉衍豔現場演講整理所得。
歡迎來到PLUS演說會,我是葉衍豔,在跨界到法律智慧公司華宇元典之前是一名檢察官,也曾被評為全國十佳公訴人。作為一名從傳統法律行業轉型到法律人工智慧領域的從業者,我今天不是來告訴大家法律AI到底有多美,而是想揭開法律AI的面紗,描述它當下真實的模樣。

PLUS演說會現場
什麼是它真實的模樣呢?舉個例子,我們知道,法律關係的準確判斷,是訴訟中的重要內容。這是一個簡單的案例,請大家看下這樣一個事實構成什麼法律關係?

系統會首先分析最有可能構成危險駕駛罪;但是,還可能構成什麼法律關係呢?系統告訴我們,還可能構成責任保險合同糾紛和財產損失方面的糾紛。你想到了嗎?這是我們招聘新人的測試題,有沒有發現,其實在這個問題上機器好像考慮得比法律系畢業生都周全。系統是怎麼知道的呢?這是基於歷史上大量同樣案情事實,從歷史裁判文書中識別出來的。機器可以藉助標籤資料像人一樣判斷這個事實在當下構成什麼樣的案由。
但是,這樣一個智慧系統是否可能代替法律人的判斷?當然不能。第一,對於複雜案件的案由判斷,實踐判決的結果往往是不一致的。這種情況下機器的判斷也不可能有絕對的正確答案。
舉個特簡單的例子,在燒烤攤吃夜宵,行為人因對服務不滿和服務員發生口角,繼而動手打了服務員,實際判決一多半認定尋釁滋事,還有相當一部分認定故意傷害。 機器不能根據過往判決武斷的判斷一定就認定尋釁滋事或故意傷害,但是可以有效展示和分析過往判決的多樣性,從而給司法人員更全面的參考。 第二,正由於機器判斷案由是根據過往資料,因此當出現全新罪名、新型犯罪的時候,機器判斷的準確度會明顯折扣。想要讓機器像司法人員一樣從法律用語的解釋角度完全自定義認定分析一個新行為新案由,至少在目前是不現實的。
那麼,如果說定性比較困難,量刑問題是不是能交給機器分析呢?相對於定性分析,量刑更多是根據大資料進行的定量分析,從這個角度看是AI更能發揮優勢的領域。
還是剛才朗某某醉駕的例子,法律規定對危險駕駛罪判處拘役並處罰金,但是,究竟拘役一個月還是六個月,罰金罰多少,雖然有最高法量刑指導意見的指導,但司法實踐中類似的案件處理差別仍然較大。AI系統可以建立在對歷史資料分析的基礎上作出判斷,並且能直觀分析給出量刑建議的依據是什麼。


AI系統,在很大程度上能避免由於過於主觀而導致的量刑偏差,有利於刑罰裁量的均衡性。但是,我們知道法律判斷一定包含經驗判斷,許多經驗可以被機器提取固化定量,但一定也有些是難以實現的。例如同樣是認罪認罰,但是被告人不同的家庭背景,在法庭上認罪悔罪程度的不同,甚至法官個人不同的情感認知等等,都或多或少會影響到法官的自由裁量。例如為購買奢侈品滿足虛榮心而惡意透支信用卡,與為了救治患病家屬惡意透支信用卡,動機區別都可能影響實際的刑罰裁量。技術並不能完全精準提煉覆蓋所有的可能性內容。因此大資料量刑,再精準也只是輔助,仍然需要人工的確認。
這或許就是法律人工智慧的真實當下。AI在定罪和量刑這兩大司法場景的運用,一方面體現了法律AI的重要意義和基本模式,即根據過往的大資料,構建資料模型,從而實現智慧推送,輔助辦案。另一方面,也體現了目前AI對司法的輔助還是明顯侷限的。 借用《三體》作家劉慈欣的話,法律AI不過處在剛剛起步的史前時代。 作為一家眾多法律人蔘與的公司,華宇元典在邁往未來的努力中,也一直致力於告訴大家這個真實的當下。元典在2017年智合論壇上就論述了“法律人工智慧的真實當下和可能性未來”。
無論是現有模式的運用,還是未來侷限的突破,都需要法律人的深度參與,法律AI不止是演算法工程師的事業,同樣也是法律人的事業。
首先,機器需要能夠從過往判決書等法律文字中提取出和定性量刑有關的資料。這個需要怎麼提取呢?是否可以從文字資訊相似的角度直接提取呢?

我們來看下,文字資訊相似包括詞語級別的相似,句子級別的相似和篇章級別的相似。詞語角度,數額較大和資料巨大,屬於文字相似,但是一字之差往往決定法定量刑的重大區別;句子角度,被告人主動到公安機關投案,和被告人被家屬扭送在去派出所途中被民警抓獲,是完全不相似的兩個句子,但都符合自首中自動投案的法律含義;篇章角度,相似的時間地點,相似的行為手段,相似的起因經過和結果,都是因為鄰里糾紛被告人猛擊被害人頭部導致被害人倒地重傷。但是被害人自身具有先天性身體疾病這一個細節,就決定案件的關鍵事實和結果重大不同,因為被害人的特異體質很可能阻卻故意傷害因果關係的成立。可見僅靠技術發展並不能滿足法律AI的運用。因此,需要法律人的深度參與,和技術人員一起全面分析解讀各種法律文字,構建法律知識圖譜,從監督學習過渡到機器學習,幫助機器自動認知各種法律概念。
機器提取出定罪量刑有關的資料後,還需要建構相關的資料模型。無論是犯罪認定的模型還是量刑判斷的模型,對應的知識建模,相關框架系統的建構,法律規則的運用,目前都不是機器能夠完全自動實現的,很大程度上都需要人工的輔助,這顯然也離不開法律人和技術人的深度合作。 所以,在法律AI這個行業有句經典的話“有多少人工,就有多少智慧”。
剛才,我一直在給法律AI潑冷水,讓大家看到真實的當下並不盡如人意。那麼法律AI可能的未來是什麼呢?恐怕很難給出令所有人都信服的答案,但可以肯定的是,未來絕不是虛幻的機器人法官,而是法律行業的各種改變。
波士頓諮詢公司的一份報告指出,現有的法律科技已經可以替代30%-50%的初級律師的工作。摩根大通已啟用機器人審查合同,每秒的工作量相當於律師工作了360000小時。律師工作如此,其他法律工作也如此。
未來,大量的基礎性法律工作都將被機器取代。因此,法律人既要學習如何高效使用技術的手段輔助自己的工作,又要學習如何讓自己成為AI時代中不可取代的部分。AI時代的法律人,需要新的思維,新的工作方式,正如《躍遷》一書所言, 需要學習用機器學習和處理資訊,用大腦整合和創新思想,用系統思維思考問題。這才是未來最有競爭力的法律人。 這也是為什麼元典和各大高校廣泛合作的原因。元典和清華大學成立法律與大資料研究中心;和北京大學成立法律人工智慧研究中心和實驗室,合辦法律人工智慧的系列講座及暑期課程等等,都是為了從高校階段就開始培養複合型的法律人才。

當我從一名檢察官轉身來到法律人工智慧的行業後,總有人問我是否為放棄檢察官的身份遺憾。在我看來,之前做公訴人主要是通過辦案實現法律的公平正義,而我現在所做的事情,和自己一直追求的法律的公平正義是一致的,只不過是換了一種方式去實現。法律和技術密結合的方式,或許是這個新時代所呼喚的更高效的方式。