1. 程式人生 > >文因互聯鮑捷:智慧金融決戰前夕,我們架起的“步槍”和“刺刀”|AI聚變

文因互聯鮑捷:智慧金融決戰前夕,我們架起的“步槍”和“刺刀”|AI聚變

這裡寫圖片描述

欄目簡介:自動駕駛、教育、金融、醫療…如你所知,AI如毛細血管一般正滲透到各行各業,人們為“AI+”可能帶來的爆炸效能量而奔走呼號,但也更願意看到腳踏實地的技術實現和商業落地。為此,《AI聚變》將深入報道各行業公司的 AI 落地情況,以及未來發展的種種可能性。

作者 | Just

如果你仔細傾聽一個人的談吐,你會發現某些透露此人想法的關鍵詞在反覆出現,尤其當這個人還是企業家的時候,這些詞彙背後體現的則是治理公司的一套打法,它們必有出處。

對@西瓜大丸子湯而言——在新浪微博上,他有 5.2 萬個粉絲,雖然沒有加 v 認證,但也算是小 v 了,平常發一些創業感想、技術思考、生活碎記,還有詩……總之內容像是一鍋大雜燴。——“黑貓白貓論”、“農村包圍城市”等黨在探索中國改革道路時留下的經典理論是他在談論公司發展時的高頻詞。

他應該從那些文史裡汲取了不少養分。採訪當天早上他讀的書是《參謀助手論——為首長服務的藝術》,從書名上你不難猜想大概內容,他發在微博上的評語是“片言苟會心,掩卷忽而笑”。此刻,在他窗戶朝南的辦公室裡,東北方向的兩面牆被大書架所佔據,其中不乏有《史記》、《韓非子》等書籍。對了,屋裡還有一隻剛入職三個月的貓,阿醜。

採訪就要開始了,但他突然打斷向身邊同事詢問其他兩個同事的去向,“在下午兩點,(他們)必須——高度一致。”



這裡寫圖片描述
圖/受訪者提供

1.

鮑捷是@西瓜大丸子湯的現實姓名,他的實際身份是文因互聯的創始人,他們提供智慧金融技術與服務。實際上,這家創業公司是他的第二次創業,2013 年初次創業時,他們花了兩年時間做了一個叫“好東西傳送門”的推薦引擎,但始終無法變現。隨後,在綜合各種因素排除其他創業選項後,團隊將目光轉向智慧金融。

他們希望做出“金融神經系統”,這與其他企業宣傳的“金融大腦”等標籤表意趨同,所不同的是其核心,文因互聯是以知識圖譜為基礎來構建整個系統。

鮑捷將其劃分為四個階段。最基礎的層次是流程的自動化,比如審計、信貸、監管、證券的自動化。他們已為審計事務所提供了從財務審計到法務審計的服務,如財務資料自動化提取和自動化複合;為證券類客戶做了自動財務健康度評測系統、風險評測系統。

其次,自動化之後會帶來知識資產化——不止資料,鮑捷認為知識才是金融機構的最核心。現在大量文件中的知識是由人工讀取然後儲存在大腦,而當機器有了自動化處理能力後,知識會越來越多沉澱在機構系統裡。當然,這個過程中除了 NLP 技術外,可能還有區塊鏈等新技術的參與。

再從機構內部擴大到機構之間的資料交換層面,有了金融的知識圖譜後,中國所有的金融機構、政府、研究機構間會構造出一個巨大的近乎實時的資料分發網路,鮑捷稱其為“金融資料高速公路”。

最終要實現從手工業金融到大工業金融的轉變可能需要花相當長的時間,他認為 20 年後的金融業會更像軟體行業,“以天為單位的資料交換都要縮短到以秒為計,上市公司債券的風險檢查從一個月縮短到 5 分鐘”。

回到當下行業現狀,手工業金融的進階並非易事。由於金融機構內部目前無法改變 IT 系統,從源頭解決金融資料的結構化寸步難行。事實上還可能是倒退的,鮑捷解釋說,一部分資料在源頭上已經是結構化資料,但機構間交換資料時卻轉換成了由人工讀寫的 PDF 檔案甚至是掃描件這樣的自然語言,“估計有 200 萬人力浪費了”。

他們現在所做的是從介面層面幫助交易所、券商、諮詢公司、律所機構等做公告、研報、法規、新聞、甚至掃描件的結構化,這是他們當前的一個“核心”工作。

切入點很明確,他們要從阻力最小的單點逐個擊破。

2.

要想攻陷每個陣地,需要的是全鏈條的資料結構化能力,包括財務報表的公開化提取能力,還有公告、研報、法規的解析,解析後再進行實體連結,對映到知識圖譜上,之後是規則建模與推理、語義搜尋、自然語言問答。

具體而言,文因互聯的技術鏈條主要圍繞結構化資料生成和結構化資料使用兩部分:

結構化資料的生成首先需要機器理解文件,比如理解自然語言文件和理解影象,那如何提取 PDF 檔案中的數字?這又分為資料清洗、恢復篇章結構到段落、提取元素這三大步驟。提取元素後要做年報、研究報告等渠道的資料整合,將其中提到的大量如人名、機構名等“實體”進行實體識別和實體連結,然後形成知識圖譜。隨後是結構化資料的使用,他們要把不同客戶業務系統中的業務規則與這些資料作關聯,這涉及到推理、規則引擎等技術。

對應到產品上,由於 AI 本身的高度複雜性,當它與金融等行業屬性結合時,面臨的則是數量級的複雜度。

“康威定律”的啟發在於,一個複雜系統不應該從一開始就追求大而全,而要從一個簡單系統開始,注重系統的演化能力。所以鮑捷認為基於經驗觀察設計出來的 2B 產品幾乎無一例外都會失敗,即便這類產品的幕後推手是大企業也會“完蛋”,這類有實力、有生命力的產品都需要從實踐案例中總結。

以史為鑑,他拿俄中兩國改革方案作類比:俄國改革是“休克療法”,由諾貝爾獎獲得者設計的方案卻在現實執行時一塌糊塗,中國改革是“摸著石頭過河”就成功了。他認為做人工智慧產品理應屬於後者。

他們現在還處在做公報和研報解析的初級場景上,鮑捷提及場景躍遷的概念,認為他們的應用場景半徑會從 10 億擴充套件到 100 億甚至 1000 億。“當你從實踐中總結出來的那些點逐漸到位時,就會發現技術不斷在解鎖場景,場景其實一直在那裡,只是因為技術沒有到那裡。”既然如此,做好結構化資料、自然語言理解語義引擎等大量的基礎技術工作不可或缺,且無捷徑可走,“認不清楚這一點的,就不要在這個行業混了。”

行業競爭已經到了非常激烈的程度,這是鮑捷對行業趨勢的感受。他近期寫了幾篇未公開發布的存稿,其中一篇完稿於 5 個月前,文中寫“2019 年會是智慧金融的決戰年”,但他現在提前了這一時刻,“今年第四季度就是決戰季”。

時間的提前是因為他覺察到金融投資的寒冬將至,屆時這一階段的對決會在整個行業準備不足的狀態下進行。他沒有給出有足夠說服力的依據,但篤定於自身對行業競爭在一年之內塵埃落定的判斷,“大多數人還沒有意識到戰爭開始的時候,就已經結束了,明年這個時候砸 100 億都沒用。”

那文因互聯會如何應戰?鮑捷告訴 AI科技大本營,取勝的關鍵在於團隊凝聚力,這考驗核心團隊的攻城能力,以及公司新人的成長性。而在他看來,文因互聯團隊在三年長征中獲得的最寶貴財產就是塑造了一支堅強的核心隊伍,身在其中的每個人的要求都是軍官標準。

儘管戰役是否會如他所料想的那樣如期而至還是未知數,“但刺刀已經架在步槍上了,”與採訪前告誡他的軍官“保持一致”時的相似口吻,首長鮑捷似乎在指示他們要瞄準,“我們會一寸一寸贏得這個市場。”

這裡寫圖片描述