1. 程式人生 > >大數據調整集群當中的磁盤占用(HDFS)和存的數據的副本數的調整

大數據調整集群當中的磁盤占用(HDFS)和存的數據的副本數的調整

占用 導入 有效 ica ati hdf cati 重新 cat

最近剛搭建的Hadoop集群(CM),發現在通過sqoop導入數據使整個集群當中的磁盤都快占滿了。這個時候考慮到需要對集群當中數據的副本數進行修改(由原來的3個副本修改為現在的1個副本)

dfs.replication  將這個參數的值由3變為1

然後我們在對之前到如到HDFS上面的文件進行重新設置副本數。命令如下:

hadoop fs -setrep -R 1 /  將根目錄下的文件的副本數設置為1個。

然後我們使用CM對集群當中的資源進行平衡操作。截圖如下:

技術分享圖片

平衡之後,我們就可以看到整個集群當中磁盤的占用情況進行了改善:

具體的截圖如下:

技術分享圖片

技術分享圖片

至此集群當中的磁盤占用沒有那麽多得到了有效的改善。

大數據調整集群當中的磁盤占用(HDFS)和存的數據的副本數的調整