1. 程式人生 > >什麼是大資料?大資料的5v特徵知多少?

什麼是大資料?大資料的5v特徵知多少?

**

什麼是大資料?大資料的5v特徵知多少?

**
大資料的5v特徵

大資料是指那些超過傳統資料庫系統處理能力的資料。它的資料規模和轉輸速度要求很高,或者其結構不適合原本的資料庫系統。為了獲取大資料中的價值,我們必須選擇另一種方式來處理它。

大量化Volume
非結構資料的超大規模和增長,總資料的80~90% ,比結構化資料增長快10倍到50倍,是傳統資料倉庫的10倍到50倍。

價值化Value
大量的不相關資訊,對未來趨勢與模式的可預測分析,深度複雜分析(機器學習,人工智慧vs傳統商務智慧)

多樣化Variety
大資料的異構和多樣化,很多不同的形式(文字 影象 視訊 機器資料),無模式或者模式不明顯,不連貫的語法或句義

快速化Velocity
實時分析而非批量式分析,資料輸入,處理與丟棄,立竿見影而非事後見效。

真實性Veracity
大資料中的內容是與真實世界中的發生息息相關的,研究大資料就是從龐大的網路資料中提取出能夠解釋和預測現實事件的過程。

一般情況下,大資料是以P8 EB ZB為單位進行計量的
1PB相當於50%的全美學術研究圖書館藏書的資訊內容
5EB相當於至今全世界人類所講過的話語
1ZB如同全世界海灘沙子數量總和
1YB相當於7000位人類體內的微細胞總和
大資料技術進展,目前,大資料領域每年都會湧現出大量新的技術,成為大資料獲取,儲存,處理分析或視覺化的有效手段。大資料技術能夠將大規模資料中隱藏你給的資訊和知識挖掘出來,為人類社會經濟活動提供依據,提高各個領域的執行效率。甚至整個社會經濟的集約化程度。