案例 7: 数据分组与聚合 - 使用 groupby 进行分析
 
知识点讲解
数据分组和聚合是数据分析中的强大工具,它们使我们能够按照某个或某些特定的列将数据分组,并对每个分组应用聚合函数,以便进行分析。
示例代码
基本分组与聚合
# 按照某列分组并计算每组的平均值
grouped_avg = df.groupby('Column').mean()
print(grouped_avg)
 
多列分组
# 按照多列分组
grouped_multiple = df.groupby(['Column1', 'Column2']).sum()
print(grouped_multiple)
 
分组后应用多个聚合函数
# 对分组数据应用多个聚合函数
grouped_multiple_agg = df.groupby('Column').agg(['mean', 'sum', 'count'])
print(grouped_multiple_agg)
 
使用 transform 方法
# 对分组后的数据应用 transform 方法
grouped_transform = df.groupby('Column')['AnotherColumn'].transform('mean')
df['GroupedMean'] = grouped_transform
print(df.head())
 
代码解释:
groupby('Column')根据指定列进行分组。- 可以使用各种聚合函数,如 
mean(),sum(),count()等。 agg方法允许对分组后的数据应用多个聚合函数。transform方法可以对分组后的数据应用一个函数,并保持原始数据的形状。
通过分组和聚合,可以更深入地理解数据的内在结构和特征。