python如何進(jìn)行數(shù)據(jù)分析 想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?
想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、h
想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?
大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、hive、spark等。這些東西更傾向于數(shù)據(jù)工程、數(shù)據(jù)處理和計(jì)算。Python語言,包括pandas、numpy、SciPy等數(shù)據(jù)分析擴(kuò)展包,通過學(xué)習(xí)使用這些包,可以充分掌握數(shù)據(jù)分析的能力。因此,要學(xué)習(xí)數(shù)據(jù)分析,建議學(xué)習(xí)Python而不是大數(shù)據(jù)。
會用Excel,真的需要再學(xué)Python嗎?
雖然這種方法可以快速生成結(jié)果,而且效率很高,但因?yàn)樗褂昧嗽O(shè)計(jì)良好的組件,所以您基本上可以遵循規(guī)則。遇到問題時(shí),不能向下推組件并重建它們。您只能更換其他組件或更改組合方法;
并且不能使用大量數(shù)據(jù),因?yàn)镋xcel的邏輯關(guān)系太弱,就像積木一樣,處理萬級數(shù)據(jù)有點(diǎn)困難,就像倒塌一樣,所以Excel不能用來建造高層建筑。畢竟,世界上沒有高樓是用積木建造的。
從數(shù)據(jù)分析的角度看,Excel的可視化效果較差,數(shù)據(jù)采集無法與Python相比。這不是Excel的特長,但是Excel在數(shù)理統(tǒng)計(jì)方面的表現(xiàn)還是很好的
所以當(dāng)數(shù)據(jù)量比較小的時(shí)候,你想快速得到結(jié)果,而且邏輯關(guān)系簡單,Excel很香
!缺點(diǎn)是您需要能夠做任何事情。你需要能夠建造墻壁,建造和繪制圖紙。自然比excel難學(xué)
從效率上講,處理簡單的問題肯定比excel差,但面對復(fù)雜的問題,Python的優(yōu)勢可以凸顯
有了這堆原材料,你不僅可以建造高樓,還可以建造飛機(jī),船和火箭頭,所以人們說,Python是一種通用語言,它可以做任何事情,除了生孩子
另一點(diǎn)是,Python是開源的,至少比matlab(深執(zhí)迷)好得多
從數(shù)據(jù)分析的角度來看,Python絕對比excel、數(shù)據(jù)采集,數(shù)據(jù)處理和數(shù)據(jù)分析、可視化都比excel好,當(dāng)然這只是用于數(shù)據(jù)分析
當(dāng)數(shù)據(jù)量大、邏輯關(guān)系復(fù)雜時(shí),Python是最佳的解決方案
PS:
當(dāng)然VBA是另一點(diǎn)。其實(shí),我覺得VBA的學(xué)習(xí)難度和python沒有太大區(qū)別,但是使用起來太難了。讓我們看看個(gè)人的具體需求。這里我不詳細(xì)說明具體的區(qū)別