跳转至

在熊猫数据框上创建视图|设置–2

原文:https://www.geesforgeks.org/creating-view-on-pandas-data frame-set-2/

先决条件:在熊猫数据框上创建视图|设置–1

很多时候,在进行数据分析时,我们所处理的大型数据集有很多属性。所有的属性不一定都同等重要。因此,我们希望只处理 dataframe 中的一组列。为此,让我们看看如何在 Dataframe 上创建视图,只选择那些我们需要的列,而留下其余的。

给定一个包含 nba 数据的数据框,在其上创建视图,以便只包含所需的列。

注意:要链接到代码中使用的 CSV 文件,请点击此处

解决方案#1: 将 csv 文件中的数据读入 Python 时,我们可以选择所有想要读入 DataFrame 的列。

# importing pandas as pd
import pandas as pd

# list of columns that we want to
# read into the DataFrame
use_cols =['Name', 'Number', 'College']

# Reading the csv file
df = pd.read_csv('nba.csv', usecols = lambda x : x in use_cols,
                                             index_col = False)

# Print the dataframe
print(df)

输出:

解决方案#2 : 将 csv 文件中的数据读入 Python 时,我们可以列出所有不想读入 DataFrame 的列。就像放下那些柱子。

# importing pandas as pd
import pandas as pd

# list of columns that we do not want
# to read into the DataFrame
skip_cols =['Name', 'Number', 'College']

# Reading the csv file
df = pd.read_csv('nba.csv', usecols = lambda x : x not in skip_cols,
                                                  index_col = False)

# Print the dataframe
print(df)

输出:

解决方案#3 : 我们可以使用difference()方法删除不需要的列。

# importing pandas as pd
import pandas as pd

# Reading the csv file
df = pd.read_csv("nba.csv")

# Print the dataframe
print(df)

输出:

现在我们将使用difference()方法删除那些我们不需要的列。

# Drop the listed columns
df_view = df[df.columns.difference(['Position', 'Age', 'Salary'])]

# Print the new DataFrame
print(df_view)

输出:



回到顶部