1. 程式人生 > >【轉】美國大資料創業公司

【轉】美國大資料創業公司

2015-06-07

下面是美國coursera公司工程師董飛在知乎的總結。

美國大資料創業公司篇

董飛 ·

這裡面創業公司太多了,包含提供商務資料分析,視覺化報表,大資料平臺,資料儲存,挖掘應用等,我就簡單說一些我感興趣的,它們大多在矽谷,其他的可以參考。更新是到2015年6月2日,88家。

Palantir__:融資:9.5億美元。150億美金估值,已經是超級獨角獸單獨列出來。Peter Thiel創辦大資料公司。資料整合、 資訊管理和定量的分析。連線到商業、 專有和公共資料集,並發現趨勢、 關係和異常,包括預測分析。

##############

Database

MemSQL__: 號稱最快的記憶體資料庫。

GraphSQL__:高效、大容量的圖形資料庫和分析平臺,創始人是國人。

MongoDB__: 融資:3.11億美元。細分行業:面向文件資料庫採集。它靈活的儲存方式非常受青睞。

DataStax__:融資:1.9億美元。細分行業:基於Apache Cassandra的資料庫支援平臺。客戶包括eBay、Adobe、Netflix等

Couchbase__: 文件型資料庫,高效能,在LinkedIn運維也推薦使用

RethinkDB__: open-source, scalable database that makes building realtime apps dramatically easier.

Presto__:FB旗下分散式SQL查詢引擎

Hadoop

Hadoop 三劍客其中 Hortonworks 已經上市

Cloudrea__:融資:10.4億美元。細分行業:大資料分析軟體、服務與培訓。今年,這家大資料巨頭企業即將進入中國市場。

MapR__:融資:1.74億美元。細分行業:大資料分析軟體、服務與培訓。它的創始團隊來自Facebook、Google和Yahoo等公司

Altiscale__: 提供的Hadoop作為一種服務(HAAS)

Qubole__:Hadoop服務提供商,一些創業公司如Pinterest也是它的客戶

Splice Machine__: 基於Hadoop的實時大資料技術公司,支援SQL 事務處理,並針對OLAP 和OLAP 應用進行實時優化處理

Continuuity__: a Hadoop-based big data application hosting platform.

Platfora__: Provide a big data analytics solution that transforms raw data in Hadoop into interactive, in-memory business intelligence.

Nuevora__: Provide Big Data analytics applications.

機器學習

Everstring__:通過不斷地主動挖掘和分析全網線上企業資訊,結合每家企業內部的客戶關係管理系統,利用機器學習自動建立量化客戶模型預測誰是下一個客戶。

Luminoso__:自然語言處理和機器學習技術,幫助企業分析消費者在各種通訊渠道中討論的話題

Dato__:GraphLab提供了一個完整的平臺,從別的應用程式或者服務中抓取資料,讓機器學習這個模型,並將學到的知識作為基礎,自動地進行準確的預測和決策制定。

Paxata__:應用機器學習技術處理大資料難題

0xdata__:H2O 的演算法是面向業務流程——欺詐或趨勢預測

Numenta:__developed a cohesive theory, core software technology, and numerous applications all based on principles of the neocortex

Metamind__: 提供相當完美的人工智慧解決方案,這種解決方案主要由“深度學習(DL)”支援

FiscalNote__: 資料探勘軟體和人工智慧手藝預測立法機構的投票成果,從而判斷某些議案可否通過。

BI工具和其他

Looker__:一個基於Web的BI平臺,目前已以與Amazon Redshift、 Teradata Aster、HP Vertica、Greenplum、Impala、 BigQuery以及Spark等資料來源進行整合;定製和複用資料視覺化體驗。

Datameer__:開源的資料處理系統,用於構建強大的超級計算機廉價伺服器叢集。

Ginger.io:__ 為研究人員、物理學家和醫療保健人員提供相應的行為分析能力

Birst__ :從事商業智慧和資料分析,利用雲端計算來顛覆傳統的IT服務模式

gridgain__: 基於記憶體的大資料實時處理系統

DataTorrent__ :可以將資料處理速度從實時提高至“現在時”

Aerospike__:開源NoSQL資料庫,支援近實時資料分析

Accumulo__:可靠的、可伸縮的、高效能的排序分散式的Key-Value 儲存解決方案,基於單元訪問控制以及可定製的伺服器端處理

Pentaho__:以工作流為核心的、強調面向解決方案而非工具元件的BI

Metamarkets__:視覺化分析,幫助線上媒體公司分析高流量的流媒體資料

Pivotal__:一個以資料為核心的企業級PaaS平臺

Pachyderm__:Dockerized MapReduce

Premise__:走眾包資料採集途徑向金融機構提供資料

Domo__:融資:2.5億美元。細分行業:雲商務智慧。它的主要服務客戶是企業使用者,其資料庫可以幫助企業維持日常的運轉。

SumAll__:social media analytics and business dashboard

Tintri__:“智慧混合快閃記憶體”,混合了快閃記憶體和計算機硬碟驅動器

Datarella:__Big Data Strategy & Product Development

GoodData__:融資:1.01億美元。細分行業:雲商務智慧。GoodData向SaaS供應商提供技術整合服務,在平臺內獲得分析資料。

Mu Sigma__: 融資:1.95億美元。細分行業:大資料科學服務。這是一家向企業客戶提供資料分析和決策支援服務的研究公司。

Mixpanel__:有web和移動分析平臺,其提供的服務可以分析監測使用者活動

DataHero__:打著“你的資料你做主”的口號,試圖彌合大資料同普通使用者之間的鴻溝,即幫你分析跟你密切相關的資料

Opera Solutions__融資:1.22億美元。細分行業:大資料科學服務。其提供的大資料服務可以一次性採集數十億條資料。

Guavus__ 融資:1.07億美元。細分行業:智慧解決方案平臺。它的主要投資方是英特爾。

Birst__:商業智慧和資料分析,安全性隔離性

Clearstory__:大資料分析服務商,幫助企業和客戶收集、處理、分析資料

Actian__:深藏不露的資料庫公司。目前其年收入大約為1.5 億美元。對 ParAccel 的收購已經是過去5 個月中Actian 進行的第四筆收購

DataGravity__: software-based company engaged in the IT industry and is focused on providing data management services.

Civis Analytics__:big data analytics firm that helps companies, non-profits, and campaigns leverage their data to develop smarter strategy.

Quid__: Business Analytics Software

inPowered__:discover the most engaging content written about them and turn them into native ads that are promoted across the web, mobile apps

Cask.co__:helps developers and organizations deliver Hadoop solutions more quickly and effectively with the open source

Tamr__:quickly, efficiently and cost-effectively connects and enriches all of your internal or external data sources

ScalingData__/Rocana__: building software for large scale machine data (logs, metrics, etc.) and event management, specifically in the domain.

Ayasdi__: use mathematics theory to find potential patterns in data and visualize them as geometric shapes

下面是來自Bo Yang的總結

從對美國大資料市場的調研來看,我們可以得到一些啟示:

  1. 美國的資料分析市場非常大,容納超過百家公司,這得益於美國資訊化的高度發達。

  2. 雖然有很多公司,但是大家很少有重複競爭,每一家都有自己的特色,在自己的領域內發展,這也符合美國公司注重差異化相關。

  3. 傳統的商務資料分析公司在維持舊有客戶和平臺的情況下,在積極向大資料技術擴充套件。

  4. 新興的大資料技術發展非常快,但是目前還沒有到成熟階段,除了Hadoop之外,沒有其他統一的技術被各家公司採用。

  5. 新的大資料技術趨勢是快速響應,開始追求資料的實時處理和快速查詢。

相對於美國市場,中國的大資料市場還處於非常初期的階段,這可能跟中國的資訊化程度相關。做長期展望預測,如果中國的資訊化發展到美國的階段,並且公司普遍採用基於資料的量化決策機制,將會迎來一個大資料發展的爆發式增長。

參考連結

如非註明轉載, 均為原創. 本站遵循知識共享CC協議,轉載請註明來源