1. 程式人生 > >資料的計算(大資料)

資料的計算(大資料)

Hadoop的背景起源二:MapReduce

  一、什麼是大資料,本質?
        (1)資料的儲存:分散式檔案系統(分散式儲存)-----> HDFS: Hadoop Distributed File System
        (2)資料的計算:分散式計算
        
    二、如何解決大資料的計算?分散式計算
        (1)什麼是PageRank(MapReduce的問題的來源)
            (*) 搜尋排名
        
        (2)MapReduce(Java語言實現)基礎程式設計模型: 把一個大任務拆分成小任務,再進行彙總
            (*) 更簡單一點例子