1. 程式人生 > >【圖文跟進 】HADOOP 核心設計——負載均衡

【圖文跟進 】HADOOP 核心設計——負載均衡

hdfs叢集中的每一個datanode上的儲存的資料和自己的硬體佔比是相當的 這個時候我們可以認為這個hdfs叢集是負載均衡的

叢集的執行過程中,有可能造成叢集中的從節點的負載不均衡 如果叢集規模比較小的時候,叢集有自動負載均衡的能力,叢集的 自己在一段時間之後達到相對的負載均衡

叢集實現負載均衡的過程實際上就是資料塊移動的過程(跨節點)

  • 714行,預設情況下負載均衡的頻寬,1M/s  很慢的
    • 這個速度針對叢集規模比較小的時候可以的
    • 叢集規模比較大的時候就不可以了  太慢了

        

叢集規模大的時候:手動負載均衡 1.start-balancer.sh -t 10%  這個命令不會立即執行  提升負載均衡的響應時效

2.調整頻寬

/start-balancer.sh -t 10%  引數意義:datanode中最大的儲存容量佔比 最小的儲存的容量佔比不超過10%  認為負載均衡的

 hadoop01 2T 1T 50%  
 hadoop02 2T 1.1T 55%
hadoop03 2T 0.8T 40%
55%-40%=15%>10% 負載均衡