6.HBase_應用_常用資料遷移方式

阿新 • • 發佈：2018-11-06

一般情況下，我們的資料來源是：RDBMS或日誌檔案。資料遷移常用方式：使用HBase Put方式、HBase自帶MR方式、bulk load工具方式。

Java API操作HBase Put、自定義HBase MR兩種方式，我們在前面已經使用過了，重點看一下importtsv、bulk load方式。

1.HBase使用importtsv匯入資料

實際上類似與我們自己寫的mapreduce程式遷移資料

# 1. 設定環境變數
export HBASE_HOME=/usr/hdp/2.5.3.0-37/hbase
export HADOOP_HOME=/usr/hdp/2.5.3.0-37/hadoop
export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath`
# 不使用mapredcp而使用classpath的原因是classpath中帶有zookeeper需要載入的lib包
# export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase mapredcp` 

# 2. 使用hbase自帶的importtsv工具
# 第一行:執行jar包    第二行:被匯入資料的hbase表列(預設檔案格式製表符隔開)    
# 第三行:hbase表    第四行:存放載入資料檔案的hdfs目錄
yarn jar /usr/hdp/2.5.3.0-37/hbase/lib/hbase-server-1.1.2.2.5.3.0-37.jar importtsv \
-Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:age,info:address \
emp \
/user/hbase/importtsv

2.HBase使用bulk load匯入資料

利用HBase資料資訊以特定資料格式存放在HDFS上，直接在HDFS中生成HFile持久化資料檔案，然後上傳到合適位置，即：完成巨量資料快速入庫。配合mapreduce完成，高效便捷，不佔用region資源，在大資料量寫入時能極大的提高寫入效率，降低HBase節點寫入的壓力。

# 1. 設定HADOOP_CLASSPATH環境變數
export HBASE_HOME=/usr/hdp/2.5.3.0-37/hbase
export HADOOP_HOME=/usr/hdp/2.5.3.0-37/hadoop
export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath`
# 不使用mapredcp而使用classpath的原因是classpath中帶有zookeeper需要載入的lib包
# export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase mapredcp` 

# 2. 使用importtsv工具生成HFile檔案
# 第一行:執行jar包    第二行:指定
yarn jar /usr/hdp/2.5.3.0-37/hbase/lib/hbase-server-1.1.2.2.5.3.0-37.jar importtsv \
-Dimporttsv.separator=, \
-Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:age,info:address \
-Dimporttsv.bulk.output=/user/hbase/hfileoutput \
emp \
/user/hbase/importtsv

# 3. 使用hbase的MR工具completebulkload
#    將生成的hfile檔案移動到hbase regions對應的hdfs路徑,以完成hbase資料的載入
yarn jar /usr/hdp/2.5.3.0-37/hbase/lib/hbase-server-1.1.2.2.5.3.0-37.jar completebulkload \
/user/hbase/hfileoutput \
emp

6.HBase_應用_常用資料遷移方式

一般情況下，我們的資料來源是：RDBMS或日誌檔案。資料遷移常用方式：使用HBase Put方式、HBase自帶MR方式、bulk load工具方式。 Java API操作HBase Put、自定義HBase MR兩種方式，我們在前面已經使用過了，重點看一下importtsv、bu

8.HBase_應用_整合Hive

1.HBase與Hive整合配置 HBase與Hive整合：Hive資料儲存在HBase、Hive表的描述資訊儲存在Hive。因為，Hive是高延遲的，而HBase是低延遲的。我們整合的目的就是利用HBase的優勢。整合Hive建立表的方式：(1) 管理表 -&nb

7.HBase_應用_表設計

HBase的namespace中存放tables。預設情況下： default：未指定名稱空間建立的表，都在此名稱空間下存放。 hbase：系統的命令空間，主要存放：meta表、名稱空間。 1.多個列族和設定屬性 # 建立名稱空間 creat

redis叢集資料遷移方式 Hash槽和一致性hash對比，優缺點比較

叢集：是一個提供多個Redis（分散式）節點間共享資料的程式集。叢集部署 Redis 叢集的鍵空間被分割為 16384 hash個槽（slot），叢集的最大節點數量也是 16384 個關係:cluster>node>slot>key 分片: Red

redis叢集資料遷移方式 Hash槽和一致性hash對比，優缺點比較

叢集：是一個提供多個Redis（分散式）節點間共享資料的程式集。叢集部署 Redis 叢集的鍵空間被分割為 16384 hash個槽（slot），叢集的最大節點數量也是 16384 個關係:cluster>node>slot>key 分片:

雲遷移合作伙伴解決方案_雲資料遷移_資料庫遷移

Amazon Web Services 誠聘精英。 Amazon Web Services (AWS) 是 Amazon.com 的一個充滿活力、不斷壯大的業務部門。我們現誠聘軟體開發工程師、產品經理、客戶經理、解決方案架構師、支援工程師、系統工程師以及設計師等人才。請訪問我

技術實操丨HBase 2.X版本的元資料修復及一種資料遷移方式

摘要：分享一個HBase叢集恢復的方法。背景在HBase 1.x中，經常會遇到元資料不一致的情況，這個時候使用HBCK的命令，可以快速修復元資料，讓叢集恢復正常。另外HBase資料遷移時，大家經常使用到一種遷移方式是：拷貝HBase的資料目錄/hbase/data/default到新的叢集，然後在新叢集

js和原生應用常用的資料互動方式

場景1 在原生app中經常會使用到H5頁面，比如說電商中的活動頁，一些電商中的詳情頁，等等...這些頁面都有一個特點，那就是在未來修改的可能性，和一次性的機率特別的大。所以用H5的頁面是最睿智的一種選擇。一旦使用了H5那麼就少不了和原生開發的一些互動（Android, IOS）如下的方案能夠幫助你解決。

Java多執行緒與併發應用-(6)-多個執行緒之間共享物件和資料的方式

此內容來自張孝祥老師的java多執行緒與併發庫高階應用如果多個執行緒執行的程式碼相同，可以使用同一個Runnable物件，這個Runnable物件中有那個共享資料。如果多個執行緒執行的程式碼不同，這時候需要用不同的Runnable物件。將共享物件封裝在另一個物件中，然後

資料遷移常用方法

SQL SERVER幾種資料遷移/匯出匯入的實踐 SQLServer提供了多種資料匯出匯入的工具和方法，在此，分享我實踐的經驗（只涉及資料庫與Excel、資料庫與文字檔案、資料庫與資料庫之間的匯出匯入）。（一）資料庫與Excel 方法1：使用資料庫客戶端（SSMS）的介面工具。右

JavaSE_day9_常用API_Object類_String類_StringBuffer類_正則表示式_Date類_DateFormat類_Calendar類_基本資料型別包裝類

1.Object類是Java語言中的根類，即所有類的父類。它中描述的所有方法子類都可以使用。所有類在建立物件的時候，最終找的父類就是Object 方法： equals方法，用於比較兩個物件是否相同，它其實就是使用兩個物件的記憶體地址在比較。Object類中的equals方法內部使用的就

Flask高階應用05---模型和資料遷移

新建專案做好基礎配置一、Flask模型簡介 Flask預設並沒有提供任何資料庫操作的API 我們可以選擇任何適合自己專案的資料庫來使用 Flask中可以自己的選擇資料，用原生語句實現功能，也可以選擇ORM（SQLAlchemy，MongoEngine） SQLAlche

Office365 Groups and OD4B 不同tenant之間資料遷移_經驗分享

目前國內很多企業都逐漸藉助Microsoft 365的解決方案為內部員工提供現代化辦公環境，不限於可以提高企業分支機構之間的協作辦公效率，滿足跨平臺移動辦公需求，同時對企業來說也降低了IT基礎架構投入和管理成本。但隨著企業業務模型擴增，陸續有很多企業需要更高標準的Office 365 來滿足其業務需求，那麼

ios應用資料儲存方式(偏好設定)-轉

一.簡單介紹 1.很多ios應用都支援偏好設定，比如儲存使用者名稱，密碼，字型大小等設定，ios提供了一套標準的解決方案來為應用加入偏好設定功能。 2.每個應用都有個NSUserDefaults例項，通過它來儲存偏好設定。比如，儲存使用者名稱，字型大小，是否自動登入。 3.儲存位

常用資料結構的應用場景小結

1、單向連結單向連結串列適用於只從一端單向訪問的場合，這種場合一般來說：（1）、刪除時，只適合刪除第一個元素；（2）、新增時，只直接新增到最後一個元素的後面或者新增到第一個元素的前面；（3）、屬於單向迭代器，只能從一個方向走到頭（只支援前進或後退，取決於實現），查詢效率極差。

elasticsearch2.x升級到6.x 完成資料遷移

官方文件方法描述：https://www.elastic.co/guide/en/elasticsearch/reference/current/reindex-upgrade-remote.html 官方對於版本升級的規則描述：https://www.elastic.co/guid

Office 365 Groups and OneDrive for Business 不同tenant之間資料遷移_經驗分享

部落格地址：http://blog.csdn.net/shelleyliu0415 目前國內很多企業都逐漸藉助Microsoft 365的解決方案為內部員工提供現代化辦公環境，不限於可以提高企業分支機構之間的協作辦公效率，滿足跨平臺移動辦公需求，同時對企業來說也降低了IT基礎架構投入和管理

mongodb資料遷移的兩種方式

環境說明：bbs資料採集的資料越來越多，目前是50G，每天大概以200W的資料量增長。而當前伺服器1.2上面的空間不足，需要把資料遷移到空間足夠大的1.3上面去嘗試了2種方式對資料進行遷移，一種是rs

【HBase】HBase各功能元件、整合MapReduce的方式及資料遷移

1、HBase體系架構各個功能元件闡述如下：（1）Client 整個HBase叢集的訪問入口；使用HBase RPC機制與HMaster和HRegionServer進行通訊；與HMaster進行通訊進行管理類操作；與HRegionServer進行資

資料結構_棧的應用_迷宮求解問題java實現

這篇文章講述的是資料結構部分的迷宮求解問題的java實現，如有錯誤或者不當之處，還望各位大神批評指正。問題描述假設有一個迷宮使用二維陣列，牆使用1表示，路徑使用0表示，可達路徑使用*表示，試寫一演算法計算出從起點到終點的一條可行路徑。演算法分析

6.HBase_應用_常用資料遷移方式

1.HBase使用importtsv匯入資料

2.HBase使用bulk load匯入資料

相關推薦