1. 程式人生 > >OSDI '18重磅解密:螞蟻金服實時金融級分散式圖資料庫GeaBase

OSDI '18重磅解密:螞蟻金服實時金融級分散式圖資料庫GeaBase

導讀:GeaBase是具備高效能、高可用、高擴充套件性及可移植性強的實時金融級分散式圖資料庫。

當地時間2018年10月8日-10日,全球極富盛名的計算機學界頂級學術會議OSDI '18(USENIX Symposium on Operating Systems Design and Implementation,簡稱OSDI)在美國加州卡爾斯巴德舉辦。 在這裡插入圖片描述 OSDI大會期間,在螞蟻金服主辦的專題研討會上,主題為《GeaBase: A High-Performance Distributed Graph Database for Industry-Scale Applications》的演講吸引了數十位來自全球的頂尖技術專家和學者,並引發了現場熱烈的討論。 螞蟻金服集團計算儲存首席架構師何昌華

圖資料庫“明星”——螞蟻金服GeaBase

眾所周知,近十年來,圖資料庫一直是業界關注的焦點,未來的前景也被普遍看好,其最大優點是通過節點和關聯的資料模型去快速解決複雜的關係問題。毫不誇張地說,圖資料庫是為當前豐富、快速變化的網際網路應用場景而生的,因為它非常善於處理大量的、複雜的、關聯的、多變的網狀資料,而且具備奇高的效率。

由於圖資料庫擁有獨一無二的特性,因此它非常適合在社交網路、實時推薦、銀行交易環路、金融徵信系統等領域應用。基於此,螞蟻金服前瞻性地在2015年成立了專門研發圖資料庫的技術團隊,在僅僅3年多時間裡,成功研發出具有高效能、高可用性、擴充套件能力強和極佳移植性的GeaBase。

螞蟻金服平臺數據技術事業群高階演算法專家付志嵩

據螞蟻金服集團相關技術專家介紹,GeaBase(Graph Exploration and Analytics Database)是螞蟻金服完全自主研發的實時金融級分散式圖資料庫,目前,GeaBase不僅廣泛應用於螞蟻金服的生態體系內,而且已經技術開放,正與多家銀行等企業開展合作。

螞蟻金服平臺數據技術事業群高階技術專家肖涵

GeaBase到底強在哪裡?

據介紹,螞蟻金服研發GeaBase的初衷是為了滿足超大規模複雜關係網路在金融領域中的各類應用場景,既要支撐線上高併發、低延遲的實時查詢需求,又要滿足大規模模型訓練的迭代運算。

GeaBase的技術架構

一起看看GeaBase的基本特性。

首先,GeaBase支援海量的資料。目前,GeaBase支撐著螞蟻金服的多個關鍵應用場景,包括風控關係網路、資金關係網路,都達到百億個節點、千億條邊的海量資料規模,其計算查詢能力達到了非常高的水準。

其次,GeaBase擁有非常強悍的線上查詢效能,支援高併發,且具備毫秒級的低延時能力。通過與Titan的對比,可以看到無論是延時還是吞吐量,GeaBase的查詢效能都領先許多。

GeaBase還具備高可用的特性。其配置了多種容錯機制,引入了多叢集和多方位的監控體系,並配備了分散式架構的容災方案,這一切都是為了保證高可用性。

螞蟻金服還為GeaBase研發了靈活且可擴充套件的查詢語言。另外,為了和開源結合,GeaBase還將支援Gremlin圖遍歷語言。

GeaBase的雄心:技術開放

據瞭解,GeaBase現在支撐著螞蟻金服旗下支付的風險控制、反洗錢、反欺詐、反刷單、反套現、金融案件審理、知識圖譜、會員拉新、好友推薦、理財資訊推薦等眾多的業務和應用。

儘管已經在螞蟻金服的生態的多個業務場景得到廣泛應用,但GeaBase的雄心顯然不止於此,它是螞蟻金服整體技術開放戰略的堅定執行者。

目前,業界很多網際網路公司都在做圖資料庫方面的研究工作,但其中絕大多數都是基於自身系統的,因此具有較強的依賴性,剝離起來比較麻煩。而現在市面上已經商業化的圖資料庫又幾乎都不是分散式的系統,其目標使用者也主要是資料量較小的中小型企業。

螞蟻金服在設計之初就充分考慮了GeaBase系統移植的問題,因此,將其封裝成產品,打造為高效易用的接入和管控產品化平臺。這樣的好處顯而易見,那就是GeaBase可以輕鬆地移植到外部客戶的系統之中,也正因為如此,GeaBase受到銀行等企業的熱烈追捧。據介紹,目前已經有十餘家銀行有意向配置GeaBase,而且部分企業已經與螞蟻金服簽訂合作協議。