HDFS

Spark local模式連線叢集hdfs、hive

稀土掘金

2019-05-14 23:06:09

Spark提供了local、standalone、on yarn等多種執行模式，但為了保持開發環境與實際執行環境的一致性，通常都是在本地編寫程式碼，然後編譯並上傳jar包到Spark叢集除錯執行。但是面對複雜

Flume淺度學習指南

SegmentFault部落格

2019-05-14 20:19:31

flume簡介 cloudera 公司開源的，貢獻給Apache基金會 http://flume.apache.org/ http://archive.cloudera.c

運營大規模HDFS叢集必看：系統升級後，怎麼效能反而惡化了？！

2019-05-14 12:00:35

一、效能挑戰 HDFS是一個分散式系統，只要有足夠的資源，可以擴容上千個節點支援100PB以上的叢集。我們發現Hadoop叢集升級（2.5.0-cdh5.3.2-->2.6.0-cdh5.13.

一套很專業的監控方案：HDFS監控落地背後的思考

DBA+社群

2019-02-20 10:55:08

一、HDFS監控挑戰 HDFS是Hadoop生態的一部分，監控方案不僅需適用HDFS，其他元件如Yarn、Hbase、Hive等，也需適用 HDFS API提供的指標較多，部分指標沒必要

大資料技術之_04_Hadoop學習_01_HDFS_HDFS概述+HDFS的Shell操作(開發重點)+HDFS客戶端操作(開發重...

部落格園精華區

2019-02-05 22:48:00

第1章 HDFS概述 1.1 HDFS產出背景及定義其他檔案管理系統： 1.2 HDFS優缺點優點缺點 1.3 HDFS組成架構

tensorflow中一個環境變數引發的記憶體洩漏血案

TensorFlow專欄

2019-01-24 13:15:19

起因最近資訊流推薦的業務方在使用tensorflow進行分散式訓練時，反饋說程式有記憶體洩露的情況。詳細瞭解之後，現場情況是這樣的：資料從hdfs讀取，checkpoint也儲存到hdfs

Hadoop2.X大資料叢集規劃與架構設計

簡書

2019-01-23 19:07:09

第一階段：先說說偽分散式不管是HDFS和YARN，在我們之前的文章中已經說過關於偽分散式的部署和安裝。也就是我們把HDFS的兩個節點NameNode和DataNode，YARN的Res

大資料Hadoop工具python教程１-HDFS Hadoop分散式檔案系統

簡書

2019-01-21 15:14:23

Hadoop分散式檔案系統(HDFS:Hadoop Distributed File System)是基於Java的分散式檔案系統分散式，可擴充套件和可移植的檔案系統，旨在跨越大型商用伺服器叢集。 HD

Spark入門單機版安裝和操作本地和HDFS檔案

簡書

2019-01-21 15:14:23

一、Spark單機版安裝 Spark部署模式主要是四種：Local模式（單機模式，是本文講的方式，僅供熟悉Spark和scala入門用）、Standalone模式（使用Spark自帶的簡單叢集管理器

Hadoop系列008-HDFS的資料流

2019-01-18 15:56:23

HDFS寫資料流程 1.1 剖析檔案寫入 image 1）客戶端向namenode請求上傳檔案，namenode檢查目標檔案是否已存在，父目錄是否存在。

初識Hadoop之HDFS

簡書

2018-12-17 23:47:09

原文地址：https://itweknow.cn/detail?id=54 ,歡迎大家訪問。練習本文中提到的命令列介面的前提條件是至少在一臺linux機器或者虛擬機器上安裝

《十小時入門大資料》學習筆記之HDFS

簡書

2018-12-16 22:37:07

筆記目錄 HDFS概述及設計目標 HDFS架構 HDFS副本機制

分享知識-快樂自己：揭祕HDFS

部落格園精華區

2018-12-13 20:25:00

揭祕HDFS：一）：大資料（hadoop）初始化環境搭建二）：大資料（hadoop）環境搭建三）：執行wordcount案例四

Mysql 流增量寫入 Hdfs（二） --Storm + hdfs 的流式處理

部落格園精華區

2018-12-12 21:05:00

一. 概述上一篇我們介紹瞭如何將資料從 mysql 拋到 kafka，這次我們就專注於利用 storm 將資料寫入到 hdfs 的過程，由於 storm 寫入 hdfs 的可定製東西有些多，我們先不從 k

學習 Livy（一）：初識 Livy

李震的個人部落格

2018-12-11 10:43:57

除了 Apache Spark 本身提供的 spark-submit 、 spark-shell 和 ThriftServer 之外， Apache Livy 提供了另一種與 Spark 叢集互動的方式，通過