Hadoop教程:HDFS操作
啟動HDFS
首先,您必須格式化配置的HDFS檔案系統,開啟namenode (HDFS伺服器),並執行以下命令。
$ hadoop namenode -format
格式化HDFS之後,啟動分散式檔案系統。下面的命令將啟動namenode以及資料節點作為叢集。
$ start-dfs.sh
列出HDFS中的檔案
在伺服器中載入資訊後,我們可以使用“ls”查詢目錄中的檔案列表、檔案狀態。下面給出了可以作為引數傳遞到目錄或檔名的ls語法。
$ $HADOOP_HOME/bin/hadoop fs -ls <args>
將資料插入HDFS
假設我們在本地系統中一個名為file.txt的檔案,應該儲存在hdfs檔案系統中。按照下面給出的步驟在Hadoop檔案系統中插入所需的檔案。
Step 1
您必須建立一個輸入目錄。
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/input
Step 2
使用put命令將資料檔案從本地系統傳輸和儲存到Hadoop檔案系統。
$ $HADOOP_HOME/bin/hadoop fs -put /home/file.txt /user/input
Step 3
您可以使用ls命令驗證該檔案。
$ $HADOOP_HOME/bin/hadoop fs -ls /user/input
從HDFS檢索資料
假設HDFS中有一個名為outfile的檔案。下面是一個從Hadoop檔案系統檢索所需檔案的簡單演示。
Step 1
首先,使用cat命令檢視來自HDFS的資料。
$ $HADOOP_HOME/bin/hadoop fs -cat /user/output/outfile
Step 2
使用get命令將檔案從HDFS獲取到本地檔案系統。
$ $HADOOP_HOME/bin/hadoop fs -get /user/output/ /home/hadoop_tp/
關閉HDFS
可以使用以下命令關閉HDFS
$ stop-dfs.sh
原文連結:ofollow,noindex">https://www.tutorialspoint.com/...