hadoop分布式文件系統(tǒng)的特性 下面哪個程序負責(zé)hdfs數(shù)據(jù)存儲?
下面哪個程序負責(zé)hdfs數(shù)據(jù)存儲?負責(zé)“HDFS”和“數(shù)據(jù)存儲”的程序是HDFS。Hadoop分布式文件系統(tǒng)(HDFS)是一種適合在普通硬件上運行的分布式文件系統(tǒng)。它與現(xiàn)有的分布式文件系統(tǒng)有很多共同點
下面哪個程序負責(zé)hdfs數(shù)據(jù)存儲?
負責(zé)“HDFS”和“數(shù)據(jù)存儲”的程序是HDFS。Hadoop分布式文件系統(tǒng)(HDFS)是一種適合在普通硬件上運行的分布式文件系統(tǒng)。它與現(xiàn)有的分布式文件系統(tǒng)有很多共同點。但同時,它又不同于其他分布式文件系統(tǒng)。HDFS是一個高度容錯的系統(tǒng),適合部署在廉價機器上。在HDFS上運行的程序有很多數(shù)據(jù)集。典型的HDFS文件大小是GB到TB。因此,HDFS被調(diào)整為支持大文件。它還應(yīng)該以高帶寬支持集群中的數(shù)億個節(jié)點。大多數(shù)HDFS程序需要寫一次,讀很多次。一旦創(chuàng)建、寫入和關(guān)閉了文件,就不需要對其進行修改。這種假設(shè)簡化了數(shù)據(jù)一致性問題,使高吞吐量數(shù)據(jù)訪問成為可能。一個map-reduce程序或一個web爬蟲程序可以很好地適應(yīng)這個模型。
HDFS能夠存儲哪幾種文件格式?
看你保存什么視頻,超過100兆的大文件可以考慮HDFS。對于大量100KB或幾MB的小文件,例如,如果您保存原始HLS格式,元數(shù)據(jù)壓力太大,HDFS不適合,TFs不支持指定文件名(保存時它會為您分配一個),您可能需要自己維護文件命名空間。另一個選項是一致散列、CEPH或swift。CEPH是用C語言開發(fā)的,很難維護。Swift是用Python編寫的,openstack的Python代碼也非常風(fēng)騷。一般來說,小文件的開源解決方案對于基于TFs的二次開發(fā)是比較可靠的。此外,如果要構(gòu)建流媒體服務(wù),還需要考慮流媒體服務(wù)器和存儲之間的連接。當(dāng)然,HLS是最方便的。對于MP4,一些服務(wù)器軟件或nginx插件只支持訪問本地文件。是否可以優(yōu)雅地裝載到本地文件系統(tǒng)也是一個考慮因素。