Python | Pandas series.str.wrap()
原文:https://www.geesforgeks.org/python-pandas-series-str-wrap/
Python 是进行数据分析的优秀语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。 【熊猫】 就是其中一个包,让导入和分析数据变得容易多了。
熊猫 str.wrap()
是处理长文本数据(段落或消息)的重要方法。这用于将长文本数据分布到新行中,或者在超过传递的宽度时处理制表符。既然这是一种弦法, 。str 每次调用这个方法之前都要加上前缀。
语法: Series.str.wrap(宽度,**kwargs)
参数: 宽度:整数值,定义最大线宽
*kwargs* 【可选参数】 expand_tab:布尔值,如果为 True replace_white spaces:布尔值,如果为 True,每个空格字符被单个空格替换。 drop_空白:布尔值,如果为真,则删除新行开头的空白(如果有) break_long_words: 布尔值,如果为真,则删除长于传递宽度的单词。 break_on_连字符:**布尔值,如果为真,则在字符串长度小于宽度的连字符上断开字符串。
返回类型:带分割线/添加字符的序列(' \n ')
要下载代码中使用的数据集,点击这里的。
在下面的例子中,使用的数据框包含了一些 NBA 球员的数据。任何操作前的数据框图像附在下面。
示例:
在本例中,Team 列以 5 个字符的行宽换行。因此\n 将放在每 5 个字符之后。打印新团队列和旧团队列中的随机元素以查看工作情况。在应用任何操作之前,使用 .dropna()
方法移除空元素。
# importing pandas module
import pandas as pd
# reading csv file from url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# dropping null value columns to avoid errors
data.dropna(inplace = True)
# display
data["New Team"]= data["Team"].str.wrap(5)
# data frame display
data
# printing same index separately
print(data["Team"][120])
print("------------")
print(data["New Team"][120])
输出: 如输出图片所示,新列每 5 个字符后有“\n”。在打印新旧团队列的相同索引后,可以看到在 print 语句中没有添加新的行字符,python 会自动读取字符串中的“\n”并将其放入新的行中。
带有“新团队”列的数据框-
输出:
Los Angeles Lakers
------------
Los A
ngele
s Lak
ers