1. 程式人生 > >Hadoop HDFS 文件塊大小

Hadoop HDFS 文件塊大小

文件的 塊大小 0ms alt hadoop 傳輸 大於 技術分享 dfs

HDFS 文件塊大小

HDFS中的文件在物理上是分塊存儲(block),塊的大小可以通過配置參數( dfs.blocksize)來規定,默認大小在hadoop2.x版本中是128M,老版本中是64M

HDFS的塊比磁盤的塊大,其目的是為了最小化尋址開銷。如果塊設置得足夠大,從磁盤傳輸數據的時間會明顯大於定位這個塊開始位置所需的時間。因而,傳輸一個由多個塊組成的文件的時間取決於磁盤傳輸速率。

如果尋址時間約為10ms,而傳輸速率為100MB/s,為了使尋址時間僅占傳輸時間的1%,我們要將塊大小設置約為100MB。默認的塊大小實際為64MB,但是很多情況下HDFS使用128MB的塊設置。

塊的大小:10ms*100*100M/s = 100M

技術分享圖片

Hadoop HDFS 文件塊大小