python怎么用來(lái)處理數(shù)據(jù) 想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?
想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語(yǔ)言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、h
想做數(shù)據(jù)分析是學(xué)python還是學(xué)大數(shù)據(jù)?
大數(shù)據(jù)結(jié)構(gòu)中的很多組件都是用Java語(yǔ)言編寫的,還有一些是用Scala編寫的,比如Hadoop中的HDFS、MapReduce、yarn、ZK、HBase、hive、spark等。這些東西更傾向于數(shù)據(jù)工程、數(shù)據(jù)處理和計(jì)算。Python語(yǔ)言,包括pandas、numpy、SciPy等數(shù)據(jù)分析擴(kuò)展包,通過(guò)學(xué)習(xí)使用這些包,可以充分掌握數(shù)據(jù)分析的能力。因此,要學(xué)習(xí)數(shù)據(jù)分析,建議學(xué)習(xí)Python而不是大數(shù)據(jù)。
會(huì)用Excel,真的需要再學(xué)Python嗎?
雖然這種方法可以快速生成結(jié)果,而且效率很高,但因?yàn)樗褂昧嗽O(shè)計(jì)良好的組件,所以您基本上可以遵循規(guī)則。遇到問(wèn)題時(shí),不能向下推組件并重建它們。您只能更換其他組件或更改組合方法;
并且不能使用大量數(shù)據(jù),因?yàn)镋xcel的邏輯關(guān)系太弱,就像積木一樣,處理萬(wàn)級(jí)數(shù)據(jù)有點(diǎn)困難,就像倒塌一樣,所以Excel不能用來(lái)建造高層建筑。畢竟,世界上沒(méi)有高樓是用積木建造的。
從數(shù)據(jù)分析的角度看,Excel的可視化效果較差,數(shù)據(jù)采集無(wú)法與Python相比。這不是Excel的特長(zhǎng),但是Excel在數(shù)理統(tǒng)計(jì)方面的表現(xiàn)還是很好的
所以當(dāng)數(shù)據(jù)量比較小的時(shí)候,你想快速得到結(jié)果,而且邏輯關(guān)系簡(jiǎn)單,Excel很香
!缺點(diǎn)是您需要能夠做任何事情。你需要能夠建造墻壁,建造和繪制圖紙。自然比excel難學(xué)
從效率上講,處理簡(jiǎn)單的問(wèn)題肯定比excel差,但面對(duì)復(fù)雜的問(wèn)題,Python的優(yōu)勢(shì)可以凸顯
有了這堆原材料,你不僅可以建造高樓,還可以建造飛機(jī),船和火箭頭,所以人們說(shuō),Python是一種通用語(yǔ)言,它可以做任何事情,除了生孩子
另一點(diǎn)是,Python是開(kāi)源的,至少比matlab(深執(zhí)迷)好得多
從數(shù)據(jù)分析的角度來(lái)看,Python絕對(duì)比excel、數(shù)據(jù)采集,數(shù)據(jù)處理和數(shù)據(jù)分析、可視化都比excel好,當(dāng)然這只是為了數(shù)據(jù)分析
當(dāng)數(shù)據(jù)量大、邏輯關(guān)系復(fù)雜時(shí),Python是最佳的解決方案
]PS:
當(dāng)然VBA說(shuō)的不是。其實(shí),我覺(jué)得VBA的學(xué)習(xí)難度和python沒(méi)有太大區(qū)別,但是使用起來(lái)太難了。讓我們看看個(gè)人的具體需求。我不會(huì)在這里詳細(xì)說(shuō)明具體的區(qū)別
答案是肯定的,肯定的。大專怎么了?不要限制自己。
如果你想去互聯(lián)網(wǎng)行業(yè),先把自己打包,因?yàn)榛ヂ?lián)網(wǎng)還是很重視教育的;但是如果你想去傳統(tǒng)行業(yè)先做,也是一個(gè)好辦法。
你說(shuō)你不能編程,所以完全可以。事實(shí)上,即使你會(huì)編程,你也不會(huì)在實(shí)際工作中使用它。很少有人真正使用Python進(jìn)行數(shù)據(jù)分析。他們可以對(duì)其進(jìn)行建模并在業(yè)務(wù)上加以利用。
為什么企業(yè)需要數(shù)據(jù)分析師?試想一個(gè)跨部門擁有海量數(shù)據(jù)的企業(yè),如何提取有效的數(shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)化為清晰的圖表,呈現(xiàn)給管理者進(jìn)行決策?這是需要數(shù)據(jù)分析師的地方。
分析師玩數(shù)據(jù)庫(kù),建立數(shù)據(jù)倉(cāng)庫(kù),使用Bi可視化工具獲取全局?jǐn)?shù)據(jù)視圖,分析過(guò)去的性能,了解當(dāng)前的問(wèn)題并預(yù)測(cè)企業(yè)的未來(lái)發(fā)展,并將最終結(jié)果呈現(xiàn)給企業(yè)管理者以輔助決策。
分析師需要掌握哪些技能?
SQL非常重要,您的SQL查詢能力直接決定您能否得到一份工作,是的,得到一份工作。因?yàn)橛胁煌母倪M(jìn)方法,比如ETL開(kāi)發(fā)、數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)、報(bào)表等等,但是首先要通過(guò)這一行的門檻,那就是SQL。
DW(數(shù)據(jù)倉(cāng)庫(kù))提高了我們的查詢能力,確保了數(shù)據(jù)的安全性。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)可以根據(jù)需要排列成不同的模型。
以finebi為例,它不僅可以拖放形成圖表,還可以連接各種數(shù)據(jù)源,進(jìn)行數(shù)據(jù)轉(zhuǎn)換、清洗、建模、發(fā)布和共享。!EXCEL其實(shí)是很好做的基礎(chǔ),特別是對(duì)于金融公司來(lái)說(shuō)。