跳转至

Python | Pandas data frame.to_dict()

原文:https://www.geesforgeks.org/python-pandas-data frame-to_dict/

Python 是进行数据分析的优秀语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。 【熊猫】 就是其中一个包,让导入和分析数据变得容易多了。

Pandas .to_dict() 方法用于根据 orient 参数将数据帧转换为系列或列表类数据类型的字典。

语法:data frame.to_dict(orient = ' dict ',into=)

参数: 方向:字符串值(‘dict’,‘list’,‘series’,‘split’,‘records’,‘index’)定义要将列(系列)转换成哪种数据类型。例如,“列表”将返回关键字=列名和值=列表(已转换系列)的列表字典。 变为:类,可以传递一个实际的类或实例。例如,在 defaultdict 的情况下,可以传递类的实例。这个参数的默认值是 dict。

返回类型:转换为字典的数据帧

要下载下例使用的数据集,点击这里的 在下面的例子中,使用的数据框包含了一些 NBA 球员的数据。任何操作前的数据框图像附在下面。

示例#1: 默认转换为字典 在这种情况下,没有参数传递给 to_dict() 方法。因此,默认情况下,它会将数据帧转换为字典。

# importing pandas module 
import pandas as pd

# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")

# dropping null value columns to avoid errors
data.dropna(inplace = True)

# converting to dict
data_dict = data.to_dict()

# display
data_dict

输出: 如输出图像所示,字典的字典是由 to_dict()方法返回的。第一个字典的关键字是列名,该列以索引作为第二个字典的关键字存储。

示例 2: 转换为系列词典

在本例中,“序列”被传递给 orient 参数,以将数据框转换为序列字典。

# importing pandas module 
import pandas as pd

# reading csv file from url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")

# dropping null value columns to avoid errors
data.dropna(inplace = True)

# converting to dict
data_dict = data.to_dict('series')

# printing datatype of first keys value in dict
print(type(data_dict['Name']))

# display
data_dict

输出: 如输出图像所示,由于 data_dict['Name']的类型为 pandas.core.series.Series,to_dict()返回了一个系列的字典。



回到顶部