數(shù)據(jù)庫(kù)需求分析實(shí)例 數(shù)據(jù)分析師用哪個(gè)數(shù)據(jù)庫(kù)比較好?
數(shù)據(jù)分析師用哪個(gè)數(shù)據(jù)庫(kù)比較好?作為一名數(shù)據(jù)分析師,我已經(jīng)在這個(gè)領(lǐng)域工作了兩年多。起初,我主要使用MySQL數(shù)據(jù)庫(kù)。當(dāng)然,Oracle數(shù)據(jù)庫(kù)也被使用,特別是在金融行業(yè)或國(guó)有企業(yè)。一般公司使用MySQL數(shù)
數(shù)據(jù)分析師用哪個(gè)數(shù)據(jù)庫(kù)比較好?
作為一名數(shù)據(jù)分析師,我已經(jīng)在這個(gè)領(lǐng)域工作了兩年多。起初,我主要使用MySQL數(shù)據(jù)庫(kù)。當(dāng)然,Oracle數(shù)據(jù)庫(kù)也被使用,特別是在金融行業(yè)或國(guó)有企業(yè)。一般公司使用MySQL數(shù)據(jù)庫(kù),可能是因?yàn)镸ySQL數(shù)據(jù)庫(kù)是免費(fèi)的。另外,在一家互聯(lián)網(wǎng)公司,我認(rèn)識(shí)了mongodb。目前,一些新興的互聯(lián)網(wǎng)公司使用NoSQL的頻率更高,這一款現(xiàn)在已經(jīng)銷(xiāo)售出去了。作為數(shù)據(jù)分析員,使用數(shù)據(jù)庫(kù)通常是為了訪問(wèn)數(shù)據(jù)。至于更高級(jí)的優(yōu)化、事務(wù)處理等,一般都不提供。如果有專(zhuān)門(mén)的數(shù)據(jù)庫(kù)人員,我們只需要好好利用數(shù)據(jù)庫(kù)。
在數(shù)據(jù)分析或數(shù)據(jù)挖掘方面,除了數(shù)據(jù)庫(kù)訪問(wèn)數(shù)據(jù)外,我們還需要數(shù)據(jù)處理工具。當(dāng)然,Python是最好的選擇。Python與數(shù)據(jù)庫(kù)結(jié)合是一個(gè)日常的代碼,Python還提供了一套完整的工具,因?yàn)镸ySQL有pymysql庫(kù),Oracle與CxOracle庫(kù)結(jié)合,mongodb有pymongo庫(kù),當(dāng)然我們的數(shù)據(jù)分析工具pandas庫(kù)提供readSQL功能,支持多種數(shù)據(jù)庫(kù),直接讀入數(shù)據(jù)幀數(shù)據(jù)格式,非常方便。
綜上所述:其實(shí)大部分都是MySQL和Oracle。這兩個(gè)是SQL語(yǔ)句,差別不大。只要掌握了SQL語(yǔ)句,這兩個(gè)數(shù)據(jù)庫(kù)的問(wèn)題就不大了。Mongodb是一個(gè)新的非關(guān)系型數(shù)據(jù)庫(kù),其語(yǔ)句不是很復(fù)雜。他們之間沒(méi)有開(kāi)始工作的壓力。結(jié)合在Python中使用panda,可以非常流暢地處理數(shù)據(jù),并且數(shù)據(jù)分析會(huì)很方便,小案例。
access只用來(lái)分析數(shù)據(jù),還需要學(xué)習(xí)VBA嗎?為什么?
不適合使用access分析數(shù)據(jù)。access作為微軟的桌面數(shù)據(jù)庫(kù),能夠滿足小批量業(yè)務(wù)的數(shù)據(jù)存儲(chǔ)需求,且數(shù)據(jù)庫(kù)簡(jiǎn)單易用。你只需要掌握基本的數(shù)據(jù)庫(kù)知識(shí)就可以使用它。但是access也有一些缺點(diǎn),即一些SQL語(yǔ)句不受支持,比如limit。雖然access提供VBA編程功能,但我建議access只適合數(shù)據(jù)存儲(chǔ)服務(wù),不適合數(shù)據(jù)分析工具。數(shù)據(jù)分析建議使用Excel。另外,Excel與access數(shù)據(jù)庫(kù)的連接非常方便。如果你想學(xué)習(xí)VBA,excelvba也是一個(gè)不錯(cuò)的選擇。不過(guò),就個(gè)人體驗(yàn)而言,如果您使用數(shù)據(jù)庫(kù),建議您使用mysql,您會(huì)得到更好的體驗(yàn)。