大資料與Hadoop之間是什麼關係
廣義上講 大資料是時代發展和技術進步的產物。Hadoop只是一種處理大資料的技術手段。
“大資料”概念在1980年由維克托·邁爾-舍恩伯格及肯尼斯·庫克耶 在《第三次浪潮》首次提出,由麥肯錫公司(McKinsey)最早應用。

image
大資料的特徵
1,容量:資料的大小決定所考慮的資料的價值和潛在的資訊
2,種類:資料型別的多樣性
3,速度:指獲得資料的速度
4,可變性:妨礙了處理和有效地管理資料的過程
5,真實性:資料的質量
6,複雜性:資料量巨大,來源多渠道
7,價值:合理運用大資料,以低成本創造高價值
大資料的發展趨勢(摘自百科)
1,趨勢一:資料的資源化
2,趨勢二:與雲端計算的深度結合
3,趨勢三:科學理論的突破
4,趨勢四:資料科學和資料聯盟的成立
5,趨勢五:資料洩露氾濫
6,趨勢六:資料管理成為核心競爭力
7,趨勢七:資料質量是BI(商業智慧)成功的關鍵
8,趨勢八:資料生態系統複合化程度加強
Hadoop是什麼?
Hadoop是一個由Apache基金會所開發的分散式系統基礎架構。使用者可以在不瞭解分散式底層細節的情況下,開發分散式程式。充分利用叢集的威力進行高速運算和儲存。Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS為海量的資料提供了儲存,而MapReduce則為海量的資料提供了計算。
hdfs架構示意圖

hdfs架構示意圖
MapReduce工作原理圖

MapReduce工作原理圖
Hadoop生態圈

Hadoop生態圈
大資料需要特殊的技術,無法用單臺計算機進行處理,必須採用分散式架構。hadoop只是處理大資料的一種技術。圍繞大資料還有其它的技術
大資料和hadoop之間的關係

大資料和hadoop之間的關係
最後總結下:大資料是時代發展的產物,為了應對大資料環境下新的業務需求,相關的分散式儲存,分散式計算,大規模分散式資料庫等技術,hadoop解決了通過hdfs實現分散式儲存,通過mapreduce實現分散式計算。圍著hadoop逐步發展出一個hadoop生態圈。 hadoop大資料環境下的一種處理結束。
如果您覺得我用心了,覺得您有所收穫,麻煩關注下我吧,您的關注就是我的動力,因為有你,我就不是一個人在前行。

資料僧
歡迎來找 資料僧 一起探討大資料相關的問題。評論區留言,我們一起討論。