hadoop能用python開發(fā)嗎 Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計算系統(tǒng)框架?
Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計算系統(tǒng)框架?Hadoop支持python。我的理解是,任務(wù)通過yarn分配到工作節(jié)點,并通過shell調(diào)用。這種方法比原生Mr速
Hadoop支持用python開發(fā)嗎?還有哪些支持python的分布式計算系統(tǒng)框架?
Hadoop支持python。我的理解是,任務(wù)通過yarn分配到工作節(jié)點,并通過shell調(diào)用。這種方法比原生Mr速度慢,因此沒有得到廣泛的應(yīng)用。
Spark應(yīng)該是Python的友好框架。要說缺點,畢竟是Scala或Java風格的API,這對于Python是不夠的。在使用了panda和numpy之后,我覺得spark的API是比較基本的。
此外,python建議您學習dask和芹菜。Dask基于numpy和panda進行封裝,兼容大多數(shù)NP和PD接口。它還支持分布式和可視化界面??偟膩碚f,這是個不錯的選擇。
作為一個分布式任務(wù)調(diào)度框架,cellery并不是專門為ETL設(shè)計的,所以它的性能比dask差。但我覺得作為一個生產(chǎn)體系,芹菜比較穩(wěn)定。