Spark 背後公司 Databricks 獲 2.5 億融資,估值 27.5 億美元
美國時間 2019 年 2 月 5 日凌晨,由 Apache Spark 創始成員成立的人工智慧初創公司 Databricks 宣佈完成 E 輪融資,本輪融資由美國私人風投公司 Andreessen Horowitz 領投,微軟、NEA、Battery Ventures 等跟投,融資金額達到 2.5 億美元。該公司目前估值已經超過 27.5 億美元!
去年 6 月份,Spark 和 Mesos 的核心作者兼 Databrick 首席技術專家 Matei Zaharia 宣佈推出開源機器學習平臺 MLflow,在業界引發關注。MLflow 是一個能夠覆蓋機器學習全流程(從資料準備到模型訓練到最終部署)的新平臺,旨在為資料科學家構建、測試和部署機器學習模型的複雜過程做一些簡化工作,它的推出也意味著 Databrick 的重心將更多偏向機器學習,而不再侷限於 Spark。
很多公司都在爭先恐後地加入使用人工智慧的行列,但問題是,他們不知道如何用好它。
於是,這就成了人工智慧初創公司 Databricks 的目標。提到“人工智慧”,人們的腦海中就會浮現出機器人和自動駕駛汽車的畫面。但 Databricks 要做的是幫助企業解決與資料和智慧相關的問題,比如分析海量資料集、建立遺傳疾病和藥物發現數據庫,等等。
Databricks 執行長兼聯合創始人 Ali Ghodsi 說:“面對人工智慧,很多公司一方面躍躍欲試,另一個方面卻在苦苦掙扎。我們是唯一一家專注於如何幫助企業實現 AI 的公司。我們還沒有看到有其他公司也在做同樣的事情。”
這方面的需求在增長。Databricks 每年的常續性營收超過 1 億美元,訂閱方面的收入在 2018 年最後一個季度增至三倍。週二,Databricks 宣佈獲得由 Andreessen Horowitz 領投的新一輪 2.5 億美元融資。微軟和其他幾家公司跟投,公司的估值已經達到 27.5 億美元。
Databricks 總共融到了 4.985 億美元資金,藉助這些資金,Databricks 計劃擴大其在亞洲、歐洲和中東的快速增長業務。它希望擴充套件到健康、金融科技、媒體和娛樂領域。Ghodsi 說,滿足這種增長需求是 Databricks 面臨的最大挑戰。
納斯達克首席技術官表示,Databricks 適合在不久的將來進行 IPO。
與加州大學伯克利分校聯絡緊密
Databricks 與學術界關係密切。Ghodsi 是加州大學伯克利分校的兼職助理教授,Databricks 背後的技術始於學術研究。很多研究生與 Databricks 密切合作。
Databricks 的知名早期專案 Apache Spark 起源於加州大學伯克利分校。雖然 Spark 仍然是 Databricks 的一個關鍵產品,但現在只是 Databricks 所做眾多事情中的一小部分。Databricks 已將重點轉向機器學習,它的機器學習開源專案 MLFlow 的下載量已經超過 100,000 次。
Ghodsi 說:“作為大學的學者,你總是希望你的研究能夠給世界帶來影響。你發表論文,開發軟體,但大多數時候,人們不會使用你開發的軟體,所以也就體現不出你所期望的影響力。直到我們創辦了 Databricks,我們才離我們的目標越來越近。”
作為執行長和教授,Ghodsi 需要付出額外的工作時間,但他表示,Databricks 因此能夠從兩方都受益。
Ghodsi 說:“AI 領域發展如此之快,你必須始終站在創新的浪潮之巔。如果有更多的公司能夠與大學進行更緊密的合作,那就好了。”
Databricks 的祕密武器
Ghodsi 說,Databricks 之所以能夠發展得如此之快,是因為沒有其他公司在做同樣的事情。Databricks 有一個支援機器學習演算法和資料的平臺。與此同時,大多數公司只專注於其中一個,然後通過手動工作將它們拼接在一起。
Ghodsi 說:“坦率地說,企業對人工智慧解決方案充滿了渴望,但它們卻無從下手。它們真的很想採取行動,所以現在有令人難以置信的需求。我們一直在努力加大力度,儘可能將我們的產品推給客戶。”
Databricks 最初使用了亞馬遜的 Web 服務,但更多的客戶現在在使用多雲或混合雲。去年,Databricks 宣佈與 Azure Azure 合作,啟動了 Azure Databricks,而微軟現在成為了 Databricks 的最新投資者。
Ghodsi 回憶說,作為一家雲端計算、人工智慧和開源公司,在 Databricks 的早期階段,人們對它的這三個方面都持懷疑態度。然而,在過去的兩到三年裡,市場已經發生了巨大變化。
Ghodsi 說:“所有這三個方面現在都成為每家企業戰略的核心。我們真的很幸運能夠處在這三大趨勢的中心位置上”。
延伸閱讀
Spark 的危機與機遇:未來必然是 AI 框架倒推資料處理框架
Spark 比拼 Flink:下一代大資料計算引擎之爭,誰主沉浮?
參考連結: