【大資料】HDFS
阿新 • • 發佈:2018-11-15
一、什麼是HDFS
HDFS是什麼:HDFS即Hadoop分散式檔案系統(Hadoop Distributed Filesystem),以流式資料訪問模式來儲存超大檔案,運行於商用硬體叢集上,是管理網路中跨多臺計算機儲存的檔案系統。
HDFS不適合用在:要求低時間延遲資料訪問的應用,儲存大量的小檔案,多使用者寫入,任意修改檔案。
二、HDFS的原理
1.hdfs資料塊
HDFS上的檔案被劃分為塊大小的多個分塊,作為獨立的儲存單元,稱為資料塊,起初預設大小是64MB,從2.7.3版本改成了128MB,這個塊大小可以在hdfs-site.xml修改它的大小