pandas讀取指定單元格數(shù)據(jù) 用pandas導(dǎo)入csv表格后,怎么指定那一列是index?
用pandas導(dǎo)入csv表格后,怎么指定那一列是index?介紹panda并使用panda下的readucsv方法,讀取CSV文件,參數(shù)是文件的路徑,它是一個(gè)相對(duì)路徑,是相對(duì)于當(dāng)前工作目錄的,那么如何
用pandas導(dǎo)入csv表格后,怎么指定那一列是index?
介紹panda并使用panda下的readucsv方法,讀取CSV文件,參數(shù)是文件的路徑,它是一個(gè)相對(duì)路徑,是相對(duì)于當(dāng)前工作目錄的,那么如何知道當(dāng)前工作目錄呢?使用操作系統(tǒng)getcwd()方法在讀取前三個(gè)工作目錄后,獲取當(dāng)前工作目錄的數(shù)據(jù),檢查讀取是否正確,是否有明顯的亂碼,是什么問(wèn)題?我們需要設(shè)置參數(shù)編碼,即編碼方法。如果不設(shè)置編碼方法,則默認(rèn)值為utf8?,F(xiàn)在CSV文件是GBK編碼的,所以我們需要使用encoding=“GBK”我的編輯器是eric4。請(qǐng)注意,eric4默認(rèn)情況下不支持中文。如果你想顯示中文,前提是設(shè)置正確的編碼并在首選項(xiàng)中將其設(shè)置為utf8
Python有很多可以操作excel單元的包,其中xlrd和xlwt用于逐個(gè)讀寫。此外,還可以使用openpyxl或xlsxwriter進(jìn)行讀寫。讀寫單元格非常簡(jiǎn)單。只需根據(jù)列表讀寫元素,12ws[“A1”]=42a=WS[“A2”]。有關(guān)相應(yīng)Python模塊的用法,請(qǐng)參閱在線教程
如何用python取出excel特定列?
對(duì)于大量數(shù)據(jù),建議使用Python。VBA通常將數(shù)據(jù)存儲(chǔ)在內(nèi)存中。當(dāng)數(shù)據(jù)沒(méi)有分割,計(jì)算機(jī)配置不高時(shí),會(huì)出現(xiàn)更多的卡。經(jīng)過(guò)數(shù)據(jù)處理后,如果內(nèi)存沒(méi)有釋放,電腦也會(huì)多卡。VBA一般啟動(dòng)兩個(gè)CPU核進(jìn)行數(shù)據(jù)計(jì)算,運(yùn)算效率較低。現(xiàn)在微軟已經(jīng)停止更新VBA了,更建議大家學(xué)習(xí)python。如果只操作excel,兩種學(xué)習(xí)難度相差不大,但是Python的開(kāi)發(fā)空間會(huì)更好
另一種更方便的方法是使用power Bi的三個(gè)組件進(jìn)行數(shù)據(jù)處理,power query進(jìn)行數(shù)據(jù)處理,PowerPivot進(jìn)行分析,power Bi進(jìn)行數(shù)據(jù)處理的優(yōu)點(diǎn)數(shù)據(jù)可視化的主要觀點(diǎn)是學(xué)習(xí)周期短,數(shù)據(jù)可以自動(dòng)刷新,啟動(dòng)時(shí)間相對(duì)較快。使用這種方法,效率可能比excel快,但速度仍然不如python快。當(dāng)然,為了長(zhǎng)期的可持續(xù)性,建議大家學(xué)習(xí)python,但起步時(shí)間會(huì)比較長(zhǎng)