用pandas讀取csv表格 用pandas導(dǎo)入csv表格后,怎么指定那一列是index?
用pandas導(dǎo)入csv表格后,怎么指定那一列是index?引入pandas使用pandas下的read_csv方法,讀取csv文件,參數(shù)是文件的路徑,這是一個相對路徑,是相對于當前工作目錄的,那么如
用pandas導(dǎo)入csv表格后,怎么指定那一列是index?
引入pandas使用pandas下的read_csv方法,讀取csv文件,參數(shù)是文件的路徑,這是一個相對路徑,是相對于當前工作目錄的,那么如何知道當前的工作目錄呢?使用os.getcwd()方法獲取當前工作目錄讀取前三后數(shù)據(jù),查看一下是否讀取正確,顯然都是亂碼,這是什么問題呢?我們需要設(shè)定參數(shù)encoding,也就是編碼方式,如果你不設(shè)定編碼方式,默認是utf8,現(xiàn)在csv文件是gbk編碼的,所以需要使用encoding="gbk"我用的編輯器是eric4,注意,eric4默認是不支持中文的,如果你想要顯示中文,前提是設(shè)置正確的編碼,在preferences中設(shè)置成utf8即可
如何將pandas.dataframe的數(shù)據(jù)寫入到文件中?
步驟操作方法如下:
1、環(huán)境準備:a、右擊桌面上選擇【Open in Terminal】 打開終端。b、在彈出的終端中輸入【ipython】進入Python的解釋器中,如圖1所示。
2、導(dǎo)入所需要的包:導(dǎo)入實驗常用的python包。如圖2所示。
3、pandas數(shù)據(jù)寫入到csv文件中:將創(chuàng)建的數(shù)據(jù)寫入到/opt/births1880.csv文件中,4、pandas讀取csv中的數(shù)據(jù)Pandas是Python下一個開源數(shù)據(jù)分析的庫,它提供的數(shù)據(jù)結(jié)構(gòu)DataFrame極大的簡化了數(shù)據(jù)分析過程中一些繁瑣操作,DataFrame是一張多維的表,大家可以把它想象成一張Excel表單或者Sql表。之前這篇文章已經(jīng)介紹了從各種數(shù)據(jù)源將原始數(shù)據(jù)載入到dataframe中,這篇文件介紹怎么將處理好的dataframe中的數(shù)據(jù)寫入到文件和數(shù)據(jù)庫中。參考資料
如何用python把list里的數(shù)據(jù)寫入csv?
最常用的一種方法,利用pandas包importpandasaspd#任意的多組列表a=[1,2,3]b=[4,5,6] #字典中的key值即為csv中列名dataframe=pd.DataFrame({"a_name":a,"b_name":b})#將DataFrame存儲為csv,index表示是否顯示行名,default=Truedataframe.to_csv("test.csv",index=False,sep=",")1234567891011a_name b_name0 1 41 2 52 3 6同樣pandas也提供簡單的讀csv方法,importpandasaspddata=pd.read_csv("test.csv")12會得到一個DataFrame類型的data。