Python | Pandas data frame.nlargetst()

原文:https://www.geesforgeks.org/python-pandas-data frame-nlargest/

Python 是进行数据分析的优秀语言，主要是因为以数据为中心的 python 包的奇妙生态系统。 【熊猫】 就是其中一个包，让导入和分析数据变得容易多了。

熊猫 nlargest() 方法用于从一个数据帧或一个序列中获取 n 个最大值。

语法:

DataFrame.nlargest(n, columns, keep='first')

参数:

n: int，要选择的值的数量列:列检查值，或者用户也可以在调用时选择列。[例如:数据[“年龄”]。非最小(3)或数据.非最小(3，“年龄”)]

保留:对象以设置在重复项退出时选择哪个值。选项是“第一”或“最后”

要下载使用的 CSV 文件，点击这里。

代码#1: 提取最大 5 个值在本例中，提取最大 5 个值，然后与 sort_values()函数排序的其他值进行比较。在尝试此方法之前，会移除 NaN 值。

参考排序_值和 dropna() 功能。

# importing pandas package
import pandas as pd

# making data frame from csv file
data = pd.read_csv("employees.csv")

# removing null values
data.dropna(inplace = True)

# extracting greatest 5
large5 = data.nlargest(5, "Salary")

# display
large5

输出:

代码#2: 按 sort_values()排序

# importing pandas package
import pandas as pd

# making data frame from csv file 
data = pd.read_csv("employees.csv")

# removing null values
data.dropna(inplace = True)

# sorting in descending order
data.sort_values("Salary", ascending = False, inplace = True)

# displaying top 5 values
data.head()

输出:

如输出图像所示，两个函数返回的值相似。

我们一直在努力

apachecn/AiLearning