pandas獲取指定數(shù)據(jù)的行和列 用pandas導(dǎo)入csv表格后,怎么指定那一列是index?
用pandas導(dǎo)入csv表格后,怎么指定那一列是index?介紹panda并使用panda下的readucsv方法,讀取CSV文件,參數(shù)是文件的路徑,它是一個(gè)相對(duì)路徑,是相對(duì)于當(dāng)前工作目錄的,那么如何
用pandas導(dǎo)入csv表格后,怎么指定那一列是index?
介紹panda并使用panda下的readucsv方法,讀取CSV文件,參數(shù)是文件的路徑,它是一個(gè)相對(duì)路徑,是相對(duì)于當(dāng)前工作目錄的,那么如何知道當(dāng)前工作目錄呢?使用操作系統(tǒng)getcwd()方法在讀取前三個(gè)工作目錄后,獲取當(dāng)前工作目錄的數(shù)據(jù),檢查讀取是否正確,是否有明顯的亂碼,是什么問(wèn)題?我們需要設(shè)置參數(shù)編碼,即編碼方法。如果不設(shè)置編碼方法,則默認(rèn)值為utf8?,F(xiàn)在CSV文件是GBK編碼的,所以我們需要使用encoding=“GBK”我的編輯器是eric4。請(qǐng)注意,eric4默認(rèn)情況下不支持中文。如果您想顯示中文,前提是要設(shè)置正確的編碼,并在首選項(xiàng)中將其設(shè)置為utf8
1。前提:加載numpy、pandas和series、dataframe。生成一個(gè)序列并刪除索引為“C”的項(xiàng),如圖所示。
2. 如果要連續(xù)刪除多個(gè)指定項(xiàng),可以在下拉列表中添加這些項(xiàng)的列表。
3. 接下來(lái),讓我們看看dataframe如何刪除數(shù)據(jù),并將其轉(zhuǎn)換為具有四行四列的DF1。
4. 如果你直接使用DF1。Drop([“Beijing”、“Shanghai”]),可以刪除索引為“Beijing”、“Shanghai”的數(shù)據(jù)。這就完成了操作。
pandas如何刪除指定行?
分享一篇關(guān)于熊貓如何選擇特定索引行的文章,希望對(duì)您有所幫助:
>>>>導(dǎo)入numpy作為NP
>>>導(dǎo)入pandas作為PD
>>>索引=np.數(shù)組([2,4,6,8,10])
>>>>數(shù)據(jù)=np.數(shù)組([3,5,7,9,11])
>>>>數(shù)據(jù)=pd.數(shù)據(jù)幀({“num”:data},index=index)
>>>打?。〝?shù)據(jù))
num
2 3
4 5
67
8 9
10 11
>>>選擇索引=索引[索引> 5
]>>>打?。ㄟx擇索引)
[6 8 10
]>>>數(shù)據(jù)[“num”]。loc[選擇索引
]6 7
8 9
10 11
名稱:num,數(shù)據(jù)類型:int32
>>
請(qǐng)注意不能使用iloc。Iloc以數(shù)組的形式訪問(wèn)序列,下標(biāo)從0:]>>>> data[“num”]開始。Iloc[2:5
]6 7
8 9
10 11
名稱:num,數(shù)據(jù)類型:int32
>>>>數(shù)據(jù)[“num”]。Iloc[[2,3,4
6 7
8 9
10 11
名稱:num,數(shù)據(jù)類型:int32
>>>>數(shù)據(jù)[“num”]
>>>
試試
使用Python panda庫(kù),十行代碼。
建議安裝Anaconda或使用PIP install panda直接安裝panda。
合并工作表數(shù)據(jù),遍歷每個(gè)工作表頁(yè)面,并使用concat函數(shù)合并所有工作表數(shù)據(jù)。
重復(fù)數(shù)據(jù)消除,使用drop Duplicate()函數(shù)刪除重復(fù)數(shù)據(jù)。
要寫入合并結(jié)果,請(qǐng)使用uExecl()寫入合并結(jié)果。
希望以上分享能對(duì)您有所幫助。歡迎評(píng)論和留言。