1. 程式人生 > >大資料資源共享pdf網盤下載

大資料資源共享pdf網盤下載

涉及的內容如下: hadoop Apache的Hadoop專案已幾乎與大資料劃上了等號。它不斷壯大起來,已成為一個 完整的生態系統,眾多開源工具面向高度擴充套件的分散式計算。 支援的作業系統:Windows、Linux和OS X。 相關連結: http://hadoop.apache.org Spark 作為MapReduce之外的一種選擇,Spark是一種資料處理引擎。它聲稱,用在記憶體 中時,其速度比MapReduce最多快100倍;用在磁碟上時,其速度比MapReduce 最多快10倍。它可以與Hadoop和Apache Mesos一起使用,也可以獨立使用。 支援的作業系統:Windows、Linux和OS X。 相關連結: http://spark.apache.org Ambari

作為Hadoop生態系統的一部分,這個Apache專案提供了基於Web的直觀介面,可 用於配置、管理和監控Hadoop叢集。有些開發人員想把Ambari的功能整合到自己 的應用程式當中,Ambari也為他們提供了充分利用REST(代表性狀態傳輸協議) 的API。 支援的作業系統:Windows、Linux和OS X。 相關連結: http://ambari.apache.org HBase HBase是為有數十億行和數百萬列的超大表設計的,這是一種分散式資料庫,可以 對大資料進行隨機性的實時讀取/寫入訪問。它有點類似谷歌的Bigtable,不過基於 Hadoop和Hadoop分散式檔案系統(HDFS)而建。 支援的作業系統:與作業系統無關。 相關連結: http://hbase.apache.org Hive Apache Hive是面向Hadoop生態系統的資料倉庫。它讓使用者可以使用HiveQL查詢 和管理大資料,這是一種類似SQL的語言。 支援的作業系統:與作業系統無關。 相關連結: http://hive.apache.org Pig Apache Pig是一種面向分散式大資料分析的平臺。它依賴一種名為Pig Latin的程式設計 語言,擁有簡化的並行程式設計、優化和可擴充套件性等優點。 支援的作業系統:與作業系統無關。 相關連結: http://pig.apache.org Zookeeper