分組函數(shù)groupby python必背函數(shù)?
python必背函數(shù)?1. 函數(shù):Print string2。函數(shù):計(jì)算字符長(zhǎng)度3。Format(12.3654,“6.2F”/“0.3%”)函數(shù):實(shí)現(xiàn)格式化輸出4。函數(shù):query object T
python必背函數(shù)?
1. 函數(shù):Print string
2。函數(shù):計(jì)算字符長(zhǎng)度
3。Format(12.3654,“6.2F”/“0.3%”)函數(shù):實(shí)現(xiàn)格式化輸出
4。函數(shù):query object Type
5。Int()函數(shù),float()函數(shù),str()函數(shù):類型轉(zhuǎn)換
6。Import()函數(shù):Import library
7。3**4:3的4次方
8。打開(kāi)()。Write()函數(shù):Write file
9 def function Name(參數(shù)):自定義函數(shù)
10隨機(jī).randint()函數(shù):生成隨機(jī)數(shù)
11。函數(shù)的作用是:返回一個(gè)從1到100的列表并打印
12。Lower()函數(shù):將數(shù)據(jù)改為小寫(xiě)
13。函數(shù):將數(shù)據(jù)改為大寫(xiě)
14。啟動(dòng)開(kāi)關(guān)功能:判斷是否用s
15打開(kāi)。函數(shù):在3-1位置前插入數(shù)據(jù)
16 List()函數(shù):將字符串轉(zhuǎn)換為L(zhǎng)ist
17。Del list[2]函數(shù):刪除第二個(gè)數(shù)據(jù)元素
18 Remove(“ha”)函數(shù):刪除原始數(shù)據(jù)中的“ha”元素
19。Eval:calculate Python expression
不是一組分組函數(shù)。通常,在數(shù)據(jù)庫(kù)中執(zhí)行查詢語(yǔ)句時(shí),如果違反規(guī)定使用sum、AVG、count等聚合函數(shù),就會(huì)報(bào)告錯(cuò)誤。
例如,我們需要計(jì)算每個(gè)學(xué)生的最終分?jǐn)?shù):從成績(jī)表中選擇姓名、總和(單科分?jǐn)?shù))和總分。這樣,將報(bào)告錯(cuò)誤。必須使用group by來(lái)聲明要用作分組計(jì)算基礎(chǔ)的字段。正確的寫(xiě)作方法是:從成績(jī)表中選擇姓名、總和(單科成績(jī))作為總分,按姓名分組。
現(xiàn)在名字不夠,還要加班級(jí),所以寫(xiě):從成績(jī)表中選擇班級(jí)、姓名、總和(單科成績(jī))作為總分,按姓名分組,實(shí)際又報(bào)錯(cuò)了。
這是因?yàn)轭愔环旁诓樵兞兄校⑶覜](méi)有用group by聲明。所以它應(yīng)該是:從成績(jī)表中選擇班級(jí),姓名,和作為總分,按班級(jí)分組,姓名。
什么叫不是單組分組函數(shù)?
Pandas提供靈活高效的分組功能,使您能夠以自然的方式對(duì)數(shù)據(jù)集進(jìn)行切片、切片和匯總?;谝粋€(gè)或多個(gè)鍵(可以是函數(shù)、數(shù)組或數(shù)據(jù)幀列名)拆分panda對(duì)象。計(jì)算組摘要統(tǒng)計(jì)信息,例如計(jì)數(shù)、平均值、標(biāo)準(zhǔn)差或用戶定義的函數(shù)。對(duì)數(shù)據(jù)幀的列應(yīng)用各種函數(shù)。應(yīng)用組內(nèi)變換或其他操作,例如歸一化、線性回歸、排序或子集選擇。計(jì)算數(shù)據(jù)透視表或交叉表。分位數(shù)分析和其他分組分析。R 1。首先,讓我們看一下以下非常簡(jiǎn)單的表格數(shù)據(jù)集(以數(shù)據(jù)幀的形式):
123456789101112
Import panda as PD>>>;DF=pd.數(shù)據(jù)幀({“key1”:[“a”,“a”,“b”,“b”,“a”]。。?!版I2”:[“1”,“2”,“1”,“2”,“1”]。。。“數(shù)據(jù)1”:np.random.隨機(jī)(5),... “數(shù)據(jù)2”:np.random.隨機(jī)(5) })>> DF data1 data2 key1 key20-0.410673 0.519378 a One1-2.120793 0.199074 a two2 0.642216-0.143671 B one3 0.975133-0.592994 B two4-1.017495-0.530459 a one grouped=DF[“data1”].groupby(DF[“key1”])>>