跳转至

Python | Pandas data frame.where()

原文:https://www.geesforgeks.org/python-pandas-data frame-where/

Python 是进行数据分析的优秀语言,主要是因为以数据为中心的 python 包的奇妙生态系统。 【熊猫】 就是其中一个包,让导入和分析数据变得容易多了。

熊猫 where() 方法用于检查一个数据帧的一个或多个条件,并相应地返回结果。默认情况下,不满足条件的行用 NaN 值填充。

**Syntax:** data frame.where(cond,other=nan,inplace=False,axis=None,level=None,errors='raise ',try_cast=False,raise_on_error=None)

**Parameters:**

秒:检查数据帧的一个或多个条件。 其他:用用户定义的对象替换不满足条件的行,默认值为 NaN 替换为:布尔值,如果为真则更改数据框本身 轴:轴进行检查(行或列)

有关所用 CSV 文件的链接,请单击此处的

示例#1: 单条件操作

在本例中,将显示具有特定团队名称的行,其余行将由 NaN 使用替换。where()方法。

# importing pandas package
import pandas as pd

# making data frame from csv file
data = pd.read_csv("nba.csv")

# sorting dataframe
data.sort_values("Team", inplace = True)

# making boolean series for a team name
filter = data["Team"]=="Atlanta Hawks"

# filtering data
data.where(filter, inplace = True)

# display
data

输出:

如输出图像所示,没有 Team = Atlanta Hawks 的每一行都被 NaN 替换。

示例#2: 多条件操作

数据根据团队和年龄进行筛选。只会显示球队名称为“亚特兰大鹰队”的排和年龄在 24 岁以上的球员。

# importing pandas package
import pandas as pd

# making data frame from csv file
data = pd.read_csv("nba.csv")

# sorting dataframe
data.sort_values("Team", inplace = True)

# making boolean series for a team name
filter1 = data["Team"]=="Atlanta Hawks"

# making boolean series for age
filter2 = data["Age"]>24

# filtering data on basis of both filters
data.where(filter1 & filter2, inplace = True)

# display
data

输出: 如输出图所示,只显示队名为“亚特兰大老鹰”的排和年龄在 24 岁以上的球员。



回到顶部