亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識庫 > pandas group分組與agg聚合的實例

pandas group分組與agg聚合的實例

熱門標簽:工廠智能電話機器人 400電話申請服務(wù)商選什么 在哪里辦理400電話號碼 清遠360地圖標注方法 原裝電話機器人 西藏智能外呼系統(tǒng)五星服務(wù) 平頂山外呼系統(tǒng)免費 江蘇客服外呼系統(tǒng)廠家 千陽自動外呼系統(tǒng)

如下:

import pandas as pd
 
df = pd.DataFrame({'Country':['China','China', 'India', 'India', 'America', 'Japan', 'China', 'India'], 
     'Income':[10000, 10000, 5000, 5002, 40000, 50000, 8000, 5000],
     'Age':[5000, 4321, 1234, 4010, 250, 250, 4500, 4321]})

構(gòu)造的數(shù)據(jù)如下:

 Age Country Income
0 5000 China 10000
1 4321 China 10000
2 1234 India 5000
3 4010 India 5002
4 250 America 40000
5 250 Japan 50000
6 4500 China 8000
7 4321 India 5000

分組

單列分組

df_gb = df.groupby('Country')
for index, data in df_gb:
 print(index)
 print(data)

輸出

America
 Age Country Income
4 250 America 40000
China
 Age Country Income
0 5000 China 10000
1 4321 China 10000
6 4500 China 8000
India
 Age Country Income
2 1234 India 5000
3 4010 India 5002
7 4321 India 5000
Japan
 Age Country Income
5 250 Japan 50000

多列分組

df_gb = df.groupby(['Country', 'Income'])
for (index1, index2), data in df_gb:
 print((index1, index2))
 print(data)

輸出

('America', 40000)
 Age Country Income
4 250 America 40000
('China', 8000)
 Age Country Income
6 4500 China 8000
('China', 10000)
 Age Country Income
0 5000 China 10000
1 4321 China 10000
('India', 5000)
 Age Country Income
2 1234 India 5000
7 4321 India 5000
('India', 5002)
 Age Country Income
3 4010 India 5002
('Japan', 50000)
 Age Country Income
5 250 Japan 50000

聚合

對分組后數(shù)據(jù)進行聚合

默認情況對分組之后其他列進行聚合

df_agg = df.groupby('Country').agg(['min', 'mean', 'max'])
print(df_agg)

輸出

 Age     Income      
   min   mean max min   mean max
Country              
America 250 250.000000 250 40000 40000.000000 40000
China 4321 4607.000000 5000 8000 9333.333333 10000
India 1234 3188.333333 4321 5000 5000.666667 5002
Japan  250 250.000000 250 50000 50000.000000 50000

對分組后的部分列進行聚合

某些情況,只需要對部分數(shù)據(jù)進行不同的聚合操作,可以通過字典來構(gòu)建

num_agg = {'Age':['min', 'mean', 'max']}
print(df.groupby('Country').agg(num_agg))

輸出

 Age     
   min   mean max
Country       
America 250 250.000000 250
China 4321 4607.000000 5000
India 1234 3188.333333 4321
Japan  250 250.000000 250
num_agg = {'Age':['min', 'mean', 'max'], 'Income':['min', 'max']}
print(df.groupby('Country').agg(num_agg))

輸出

  Age     Income  
   min   mean max min max
Country          
America 250 250.000000 250 40000 40000
China 4321 4607.000000 5000 8000 10000
India 1234 3188.333333 4321 5000 5002
Japan  250 250.000000 250 50000 50000

補充:pandas——很全的groupby、agg,對表格數(shù)據(jù)分組與統(tǒng)計

我這篇groupby寫的不好。太復雜了。其實實際上經(jīng)常用的就那么幾個。舉個例子,把常用的往那一放就很容易理解和拿來用了。日后再寫一篇。

groupby功能:分組

groupby + agg(聚集函數(shù)們): 分組后,對各組應(yīng)用一些函數(shù),如'sum',‘mean',‘max',‘min'…

groupby默認縱方向上分組,axis=0

DataFrame
import pandas as pd
import numpy as np
 df = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'],
     'key2':['one', 'two', 'one', 'two', 'one'],
     'data1':np.random.randn(5),
     'data2':np.random.randn(5)})
print(df)
  data1  data2 key1 key2
0 -0.410122 0.247895 a one
1 -0.627470 -0.989268 a two
2 0.179488 -0.054570 b one
3 -0.299878 -1.640494 b two
4 -0.297191 0.954447 a one

分組,并對分組進行迭代

list(df.groupby(['key1']))#list后得到:[(group1),(group2),......]
[('a',  data1  data2 key1 key2
 0 -0.410122 0.247895 a one
 1 -0.627470 -0.989268 a two
 4 -0.297191 0.954447 a one), ('b',  data1  data2 key1 key2
 2 0.179488 -0.054570 b one
 3 -0.299878 -1.640494 b two)]

list后得到:[(group1),(group2),…]

每個數(shù)據(jù)片(group)格式: (name,group)元組

1. 按key1(一個列)分組,其實是按key1的值

groupby對象支持迭代,產(chǎn)生一組二元元組:(分組名,數(shù)據(jù)塊),(分組名,數(shù)據(jù)塊)…

for name,group in df.groupby(['key1']):
 print(name)
 print(group)
a
  data1  data2 key1 key2
0 -0.410122 0.247895 a one
1 -0.627470 -0.989268 a two
4 -0.297191 0.954447 a one
b
  data1  data2 key1 key2
2 0.179488 -0.054570 b one
3 -0.299878 -1.640494 b two

2. 按[key1, key2](多個列)分組

對于多重鍵,產(chǎn)生的一組二元元組:((k1,k2),數(shù)據(jù)塊),((k1,k2),數(shù)據(jù)塊)…

第一個元素是由鍵值組成的元組

for name,group in df.groupby(['key1','key2']):
 print(name) #name=(k1,k2)
 print(group)
('a', 'one')
  data1  data2 key1 key2
0 -0.410122 0.247895 a one
4 -0.297191 0.954447 a one
('a', 'two')
  data1  data2 key1 key2
1 -0.62747 -0.989268 a two
('b', 'one')
  data1 data2 key1 key2
2 0.179488 -0.05457 b one
('b', 'two')
  data1  data2 key1 key2
3 -0.299878 -1.640494 b two

3. 按函數(shù)分組

4. 按字典分組

5. 按索引級別分組

6.將函數(shù)跟數(shù)組、列表、字典、Series混合使用也不是問題,因為任何東西最終都會被轉(zhuǎn)換為數(shù)組

將這些數(shù)據(jù)片段做成字典

dict(list(df.groupby(['key1'])))#dict(list())
{'a':  data1  data2 key1 key2
 0 -0.410122 0.247895 a one
 1 -0.627470 -0.989268 a two
 4 -0.297191 0.954447 a one, 'b':  data1  data2 key1 key2
 2 0.179488 -0.054570 b one
 3 -0.299878 -1.640494 b two}

分組后進行一些統(tǒng)計、計算等

1. 分組后,返回一個含有分組大小的Series

按key1分組

df.groupby(['key1']).size()
key1
a 3
b 2
dtype: int64
dict(['a1','x2','e3'])



{'a': '1', 'e': '3', 'x': '2'}

按[key1,key2]分組

df.groupby(['key1','key2']).size()
key1 key2
a  one  2
  two  1
b  one  1
  two  1
dtype: int64

2. 對data1按key1進行分組,并計算data1列的平均值

df['data1'].groupby(df['key1']).mean()
#groupby沒有進行任何的計算。它只是進行了一個分組
key1
a -0.444928
b -0.060195
Name: data1, dtype: float64
df.groupby(['key1'])['data1'].mean()#理解:對df按key1分組,并計算分組后df['data1']的均值
#等價于:df.groupby(['key1']).data1.mean()
key1
a -0.444928
b -0.060195
Name: data1, dtype: float64

說明:

groupby沒有進行任何的計算。它只是進行了一個分組。

數(shù)據(jù)(Series)根據(jù)分組鍵進行了聚合,產(chǎn)生了一個新的Series,其索引為key1列中的唯一值。

這種索引操作所返回的對象是一個已分組的DataFrame(如果傳入的是列表或數(shù)組)或已分組的Series

df.groupby(['key1'])['data1'].size()
key1
a 3
b 2
Name: data1, dtype: int64

3.對data1按[key1,key2]進行分組,并計算data1的平均值

df['data1'].groupby([df['key1'],df['key2']]).mean()
key1 key2
a  one -0.353657
  two -0.627470
b  one  0.179488
  two -0.299878
Name: data1, dtype: float64
df.groupby(['key1','key2'])['data1'].mean()
#等價于:df.groupby(['key1','key2']).data1'.mean()
key1 key2
a  one -0.353657
  two -0.627470
b  one  0.179488
  two -0.299878
Name: data1, dtype: float64

通過兩個鍵對數(shù)據(jù)進行了分組,得到的Series具有一個層次化索引(由唯一的鍵對組成):

df.groupby(['key1','key2'])['data1'].mean().unstack()
key2 one two
key1
a -0.353657 -0.627470
b 0.179488 -0.299878

在上面這些示例中,分組鍵均為Series。實際上,分組鍵可以是任何長度適當?shù)臄?shù)組。非常靈活。

橫方向上

按列的數(shù)據(jù)類型(df.dtypes)來分

df共兩種數(shù)據(jù)類型:float64和object,所以會分為兩組(dtype(‘float64'),數(shù)據(jù)片),(dtype(‘O'), 數(shù)據(jù)片)

list(df.groupby(df.dtypes, axis=1))
[(dtype('float64'),  data1  data2
 0 -0.410122 0.247895
 1 -0.627470 -0.989268
 2 0.179488 -0.054570
 3 -0.299878 -1.640494
 4 -0.297191 0.954447), (dtype('O'), key1 key2
 0 a one
 1 a two
 2 b one
 3 b two
 4 a one)]

agg的應(yīng)用

groupby+agg 可以對groupby的結(jié)果同時應(yīng)用多個函數(shù)

SeriesGroupBy的方法agg()參數(shù):

aggregate(self, func_or_funcs, * args, ** kwargs)
func: function, string, dictionary, or list of string/functions

返回:aggregated的Series

s= pd.Series([10,20,30,40])
s
0 10
1 20
2 30
3 40
dtype: int64
for n,g in s.groupby([1,1,2,2]):
 print(n)
 print(g)
0 10
1 20
dtype: int64
2
2 30
3 40
dtype: int64
s.groupby([1,1,2,2]).min()
1
1 10
2 30
dtype: int64
#等價于這個:
s.groupby([1,1,2,2]).agg('min')
1 10
2 30
dtype: int64
s.groupby([1,1,2,2]).agg(['min','max'])#加[],func僅接受一個參數(shù)
min max
1 10 20
2 30 40

常常這樣用:

df

data1 data2 key1 key2
0 -0.410122 0.247895 a one
1 -0.627470 -0.989268 a two
2 0.179488 -0.054570 b one
3 -0.299878 -1.640494 b two
4 -0.297191 0.954447 a one

比較下面,可以看出agg的用處:

df.groupby(['key1'])['data1'].min()
key1
a -0.627470
b -0.299878
Name: data1, dtype: float64
df.groupby(['key1'])['data1'].agg({'min'})
min
key1
a -0.627470
b -0.299878
#推薦用這個√
df.groupby(['key1']).agg({'data1':'min'})#對data1列,取各組的最小值,名字還是data1
data1
key1
a -0.627470
b -0.299878
#按key1分組后,aggregate各組data1的最小值和最大值:
df.groupby(['key1'])['data1'].agg({'min','max'})
max min
key1
a -0.297191 -0.627470
b 0.179488 -0.299878
#推薦用這個√
df.groupby(['key1']).agg({'data1':['min','max']})
data1
min max
key1
a -0.627470 -0.297191
b -0.299878 0.179488

可以對groupby的結(jié)果更正列名(不推薦用這個,哪怕在后面單獨更改列名)

# 對data1,把min更名為a,max更名為b
df.groupby(['key1'])['data1'].agg({'a':'min','b':'max'})#這里的'min' 'max'為兩個函數(shù)名
d:\python27\lib\site-packages\ipykernel_launcher.py:2: FutureWarning: using a dict on a Series for aggregation
is deprecated and will be removed in a future version
a b
key1
a -0.627470 -0.297191
b -0.299878 0.179488

重要技巧: groupby之后直接.reset_index()可以得到一個沒有多級索引的DataFrame

之后可以通過df.rename({‘old_col1':‘new_col1',‘old_col2':‘new_col2',…})重命名

eg:

df1= df.groupby(['date'])['price'].agg({'sum','count'}).reset_index()

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • Pandas中DataFrame的分組/分割/合并的實現(xiàn)
  • pandas 實現(xiàn)分組后取第N行
  • pandas分組排序 如何獲取第二大的數(shù)據(jù)
  • pandas groupby分組對象的組內(nèi)排序解決方案
  • pandas組內(nèi)排序,并在每個分組內(nèi)按序打上序號的操作
  • pandas 實現(xiàn)某一列分組,其他列合并成list

標簽:隨州 安慶 西安 錦州 白城 股票 日照 天水

巨人網(wǎng)絡(luò)通訊聲明:本文標題《pandas group分組與agg聚合的實例》,本文關(guān)鍵詞  pandas,group,分組,與,agg,聚合,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pandas group分組與agg聚合的實例》相關(guān)的同類信息!
  • 本頁收集關(guān)于pandas group分組與agg聚合的實例的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    国产精品自拍亚洲| 午夜激情视频在线观看| 午夜久久网| 日本免费乱理伦片在线观看2018| 夜夜操天天爽| 一本高清在线| 99久久网站| 国产麻豆精品视频| 久久国产精品只做精品| 日本在线播放一区| 二级片在线观看| 国产不卡高清在线观看视频| 午夜家庭影院| 色综合久久天天综合| 久久99这里只有精品国产| 一本伊大人香蕉高清在线观看| 天天色色色| 深夜做爰性大片中文| 亚洲 欧美 91| 人人干人人草| 亚洲精品中文一区不卡| 黄视频网站免费观看| 黄视频网站免费观看| 亚洲女初尝黑人巨高清在线观看| 黄视频网站免费看| 一级女性全黄久久生活片| 精品国产亚一区二区三区| 一级毛片视频在线观看| 91麻豆精品国产高清在线| 久久国产影院| 国产91精品一区二区| 国产不卡高清在线观看视频| 99久久精品费精品国产一区二区| 国产一区二区精品| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产精品1024永久免费视频| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产网站在线| 精品国产三级a∨在线观看| 黄视频网站在线免费观看| a级毛片免费观看网站| 亚洲www美色| 韩国三级一区| 天天做日日干| 久草免费在线观看| 午夜在线亚洲| 91麻豆国产级在线| 九九九网站| 毛片成人永久免费视频| 国产网站在线| 国产精品1024永久免费视频| 日韩欧美一二三区| 久久国产精品永久免费网站| 麻豆网站在线免费观看| 久久精品欧美一区二区| 你懂的在线观看视频| 一级片片| 韩国三级一区| 国产a视频| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 日本免费看视频| 青青久久精品| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 欧美一级视频免费| 欧美激情一区二区三区在线| 可以免费看毛片的网站| 成人高清视频免费观看| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 精品视频一区二区| 国产a网| 久草免费在线色站| 日韩欧美一二三区| 日本在线不卡免费视频一区| 精品毛片视频| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 九九九网站| 日日日夜夜操| 日韩中文字幕在线亚洲一区| 久久99这里只有精品国产| 国产伦理精品| 久久精品人人做人人爽97| 国产欧美精品午夜在线播放| 成人a大片高清在线观看| 天天色色色| 免费一级片在线观看| 国产精品1024在线永久免费| 99久久精品国产高清一区二区| 日韩中文字幕一区| 一级毛片视频免费| 成人影院久久久久久影院| 欧美激情一区二区三区在线 | 国产成人精品影视| 日韩中文字幕在线观看视频| 四虎久久影院| 国产伦久视频免费观看 视频| 黄视频网站在线免费观看| 美国一区二区三区| 亚洲精品中文一区不卡| 成人影院久久久久久影院| 欧美激情一区二区三区在线| 亚洲女初尝黑人巨高清在线观看| 可以在线看黄的网站| 天天做日日爱| 精品久久久久久中文字幕一区| 国产视频久久久| 天天色色色| 国产一区精品| 国产视频一区二区在线观看| 欧美激情影院| 尤物视频网站在线| 欧美一级视频高清片| 欧美国产日韩在线| 成人免费高清视频| 精品国产香蕉伊思人在线又爽又黄| 国产高清视频免费观看| 四虎影视库| 成人免费一级毛片在线播放视频| 在线观看成人网 | 99久久精品国产片| 你懂的国产精品| 欧美电影免费| 国产国语对白一级毛片| 国产成人啪精品| 91麻豆精品国产综合久久久| 麻豆污视频| 91麻豆国产级在线| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 久久99中文字幕| 成人免费网站视频ww| 韩国三级香港三级日本三级la| 一级毛片视频免费| 午夜在线亚洲| 精品国产一区二区三区久久久狼| 国产91精品一区| 国产精品免费久久| 日日夜夜婷婷| 日韩在线观看免费| 国产91视频网| 成人免费网站久久久| 欧美a级大片| 欧美a免费| 中文字幕一区二区三区精彩视频| 日韩专区在线播放| 91麻豆tv| 欧美电影免费| 日韩av成人| 国产不卡在线观看视频| 久久久成人影院| 韩国三级香港三级日本三级la| 免费国产在线观看不卡| 精品久久久久久免费影院| 欧美国产日韩一区二区三区| 久久99欧美| 国产不卡在线看| 日韩男人天堂| 九九九网站| 国产91精品一区| 日韩专区第一页| 国产精品自拍在线观看| 日韩在线观看免费完整版视频| 精品在线观看国产| 精品久久久久久中文字幕一区 | 四虎论坛| 韩国毛片免费大片| 黄视频网站免费看| 久久精品欧美一区二区| 久久国产一区二区| 国产成a人片在线观看视频| 国产成人精品综合久久久| 日韩欧美一及在线播放| 精品毛片视频| 欧美国产日韩久久久| 国产麻豆精品高清在线播放| 黄色短视频网站| 欧美激情一区二区三区视频 | 日韩中文字幕在线亚洲一区| 日韩免费在线观看视频| 可以在线看黄的网站| 四虎影视久久久| 黄色短视频网站| 精品国产一区二区三区久 | 欧美激情一区二区三区在线 | 国产亚洲精品成人a在线| 亚洲女初尝黑人巨高清在线观看| 青青久久网| 日韩中文字幕一区| 国产极品白嫩美女在线观看看| 亚洲精品中文字幕久久久久久| 国产亚洲精品成人a在线| 精品视频一区二区三区| 亚洲第一视频在线播放| 成人影视在线播放| 久久精品免视看国产明星| 日韩专区在线播放| 久草免费在线视频| 国产精品自拍亚洲| 中文字幕97| 国产伦精品一区二区三区在线观看| 成人影院久久久久久影院| 精品视频一区二区三区|