Python | Pandas data frame.aggregate()

原文:https://www.geesforgeks.org/python-pandas-data frame-aggregate/

Python 是进行数据分析的优秀语言，主要是因为以数据为中心的 Python 包的奇妙生态系统。 【熊猫】 就是其中一个包，让导入和分析数据变得容易多了。

Dataframe.aggregate()函数用于跨一列或多列应用某种聚合。使用可调用、字符串、字典或字符串/可调用列表进行聚合。最常用的聚合是:

总和:返回请求轴的值总和 最小值:返回请求轴的值最小值 最大值:返回请求轴的值最大值

语法: DataFrame.aggregate(func，axis=0，args，*kwargs)

参数: 功能:可调用、字符串、字典或字符串/可调用列表。用于聚合数据的函数。如果是函数，则必须在传递数据帧或传递给数据帧时工作。应用。对于数据帧，如果键是数据帧列名，则可以传递字典。 轴:(默认 0) {0 或' index '，1 或' columns'} 0 或' index ':对每列应用函数。1 或“列”:对每行应用函数。

返回:聚合数据帧

有关代码中使用的 CSV 文件的链接，请单击此处的

示例#1: 在数据框中的所有列上聚合“sum”和“min”函数。

# importing pandas package
import pandas as pd

# making data frame from csv file
df = pd.read_csv("nba.csv")

# printing the first 10 rows of the dataframe
df[:10]

聚合仅适用于数值类型的列。

# Applying aggregation across all the columns 
# sum and min will be found for each 
# numeric type column in df dataframe

df.aggregate(['sum', 'min'])

输出: 对于具有数值的每一列，已经找到所有值的最小值和总和。对于数据框 df ，我们有四个这样的列数字，年龄，体重，工资。

例 2:

在 Pandas 中，我们还可以跨不同的列应用不同的聚合函数。为此，我们需要传递一个包含列名和值的字典，这些列名和值包含任何特定列的聚合函数列表。

# importing pandas package
import pandas as pd

# making data frame from csv file
df = pd.read_csv("nba.csv")

# We are going to find aggregation for these columns
df.aggregate({"Number":['sum', 'min'],
              "Age":['max', 'min'],
              "Weight":['min', 'sum'], 
              "Salary":['sum']})

输出: 已经对每一列应用了单独的聚合，如果没有对某一列应用任何特定的聚合，则它具有与之对应的 NaN 值。

我们一直在努力

apachecn/AiLearning