python提取csv指定列 python讀取多個(gè)csv文件中某一列,并生成一個(gè)新csv文件?
python讀取多個(gè)csv文件中某一列,并生成一個(gè)新csv文件?CSV可以直接作為文本讀取。它的格式是一行,由幾列逗號(hào)分隔,這與文本文件相同。讀取CSV后,用逗號(hào)分隔列,然后將需要的列寫(xiě)入新文件。只是
python讀取多個(gè)csv文件中某一列,并生成一個(gè)新csv文件?
CSV可以直接作為文本讀取。它的格式是一行,由幾列逗號(hào)分隔,這與文本文件相同。讀取CSV后,用逗號(hào)分隔列,然后將需要的列寫(xiě)入新文件。只是提供想法,我不會(huì)寫(xiě)代碼。我可以用打開(kāi)的拆分讀線讀取文件
python讀取csv文件中帶有小數(shù)點(diǎn)的的文件?
!f=pd.readCSV(“file name”,encoding=“GB2312”)
讀取文件中某些列的數(shù)據(jù)
data=F6。LOC[:,[“column name 1”,“column name 2”
]假設(shè)數(shù)據(jù)有這些列{“a”,“B”,“C”}
]如果a列的數(shù)據(jù)是{60ml,250ml,250ml,60ml,250ml,250ml,60ml,60ml,250ml,250ml,60ml,}
]只有{60250250,60250250,60,60250250,60,}可以直接寫(xiě)為:
data[“a”]=data[“a”]結(jié)構(gòu)提取物(”(d))“,expand=false)
數(shù)據(jù)[”a“]。Astype(int)
如果列中有小數(shù),如{8.86℃、8.86℃、8.86℃、8.86℃、8.86℃},如果有負(fù)數(shù),則正則化改為:-?D(?)
數(shù)據(jù)[“a”]=數(shù)據(jù)[“a”]結(jié)構(gòu)提取物(”(d(?)?:.d)?)“,如果列是一個(gè)百分比,例如{55%,63%,72%,52%,72%}
data[”a“]=data[”a“]結(jié)構(gòu)提取物(”(d(?)?:.d)?)“,Expand=false)
數(shù)據(jù)[”a“]。Astype(float)=數(shù)據(jù)[“a”]。Astype(float)*0.01
這樣就可以得到{0.55,0.63,0.72,0.52,0.72}
大量的數(shù)據(jù)。更推薦使用Python和VBA在內(nèi)存中存儲(chǔ)數(shù)據(jù)。當(dāng)數(shù)據(jù)沒(méi)有分割,計(jì)算機(jī)配置不高時(shí),會(huì)出現(xiàn)更多的卡。經(jīng)過(guò)數(shù)據(jù)處理后,計(jì)算機(jī)在不釋放內(nèi)存的情況下也會(huì)更加無(wú)卡化VBA一般只啟動(dòng)兩個(gè)CPU核進(jìn)行數(shù)據(jù)計(jì)算,運(yùn)算效率也相對(duì)較低。現(xiàn)在微軟已經(jīng)停止更新VBA了,更建議大家學(xué)習(xí)python。如果只操作excel,兩種學(xué)習(xí)難度相差不大,但是Python會(huì)有更好的發(fā)展空間
還有一種更方便的方法,那就是使用power Bi三個(gè)組件進(jìn)行數(shù)據(jù)處理,使用power query進(jìn)行數(shù)據(jù)處理,PowerPivot進(jìn)行分析,power query進(jìn)行數(shù)據(jù)處理的優(yōu)勢(shì)數(shù)據(jù)可視化的主要觀點(diǎn)是學(xué)習(xí)周期短,數(shù)據(jù)可以自動(dòng)刷新,啟動(dòng)時(shí)間相對(duì)較快。使用這種方法,效率可能比excel快,但速度仍然不如python快。當(dāng)然,為了長(zhǎng)期的可持續(xù)性,建議大家學(xué)習(xí)python,但起步時(shí)間會(huì)比較長(zhǎng)