Hadoop

零售業如何用Hadoop開啟大資料之門?

在過去幾年,全球零售商一直試圖利用大資料創造價值。由於其大資料分析基礎架構的限制,許多工作被一再推遲。Hadoop為這些零售商打開了新的大門,它可以解決他們在過去幾年在大資料領域面臨的許多問題和挑戰。

Hadoop排序

轉載來源 Hadoop排序,從大的範圍來說有兩種排序,一種是按照key排序,一種是按照value排序。如果按照value排序,只需在map函式中將key和value對調,然後在reduce函

開源SQL-on-Hadoop系統一覽

引言 查詢分析是大資料要解決的核心問題之一,而SQL作為查詢分析中使用最簡單、最廣泛的的語言之一,必然而然的催生了許多支援在Hadoop上使用SQL的系統,這就是所謂的SQL-on-Hadoop系統,其中大

大資料平臺CDH搭建

Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,簡稱“CDH”),基於Web的使用者介面,支援大多數Hadoop元件,包括HDFS、MapR

Cris 帶你快速入門 Flink

在開源世界裡,Apache Storm專案是流處理的先鋒。Storm最早由Nathan Marz和創業公司BackType的一個團隊開發,後來才被Apache基金會接納。Storm提供了低延遲的流處理,但是它

基於Hadoop搭建資料分析平臺搭建

企業發展到一定規模都會搭建單獨的BI平臺來做資料分析,即OLAP(聯機分析處理),一般都是基於資料庫技術來構建,基本都是單機產品。除了業務資料的相關分析外,網際網路企業還會對使用者行為進行分析,進一步挖掘潛在價

大資料Hadoop工具python教程9-Luigi工作流

管理Hadoop作業的官方工作流程排程程式是Apache Oozie。與許多其他Hadoop產品一樣,Oozie是用Java編寫的,是基於伺服器的Web應用程式,它執行執行Hadoop MapReduce和Pi

基於Hadoop叢集的Hive安裝配置(Derby資料庫)

Hive是一個數據倉庫基礎工具在Hadoop中用來處理結構化資料,提供簡單的sql查詢功能,可以將sql語句轉換為MapReduce任務進行執行(具體的Hive架構大家自行搜尋)。接下來主要講下Hadoop叢集

Hadoop系列008-HDFS的資料流

HDFS寫資料流程 1.1 剖析檔案寫入 image 1)客戶端向namenode請求上傳檔案,namenode檢查目標檔案是否已存在,父目錄是否存在。

1715740244.6706