1. 程式人生 > >大資料架構簡述(一):大資料的本質

大資料架構簡述(一):大資料的本質

1.大資料是什麼

大資料由SCI的首席科學家JohmR.Masey於1998年在USENIX大會上首次提出。他在其發表的一篇名為Big Dara and the Next Wave of Infrastress的論文中首次提出Big Data這個詞。

Google在2003-2006年公佈的關於GFS、MapReduce和BigTable的三篇論文推動了Hadoop的實現,而Hadoop的誕生極大促進了大資料技術的發展。

當然,Hadoop並不等同於大資料。大資料只是一門市場語言,代表的是一種理念、一種問題解決的思路、一系列技術的集合。

2.運營商大資料架構


運營商大資料架構如圖所示

第一層是應用,在運營商領域分別解決SQM(運維質量管理)、CSE(客戶體驗提升)、MSS(市場運維支撐)、DMP(資料管理平臺)等問題

第二層是各個元件/技術支撐。包括資料從產生獲取、處理(實時、批處理)、分析(互動式查詢、機器學習與資料探勘)到最後的展示

第三層,為了支援資料的儲存處理,需要統一的資源管理及分配

第四層,上層框架和處理都構建在儲存的基礎上,所以儲存是基礎中的基礎

第五層,大資料部署形態有云化部署、物理機部署等多種部署模式