使用 Pandas 读取 csv 文件时如何跳行?
由于以数据为中心的 Python 包的惊人生态系统,python 是进行数据分析的好语言。熊猫包就是其中之一,它让数据的导入和分析变得更加容易。
在这里,我们将讨论如何在读取 csv 文件时跳过行。我们将使用熊猫库的 read_csv() 方法来完成此任务。
语法:PD.read_CSV(file path_or_buffer,sep= ',',分隔符=无,标头= '推断',名称=无,index_col =无,usecols =无,挤压=假,前缀=无,mangle_dupe_cols =真,dtype =无,引擎=无,转换器=无,true_values =无,false_values =无,skipinitialspace =假,skiprows =无,nrows =无,na_values =无,keep_default_na,lineterminator =无,quotechar= ' " ',引号=0,转义符=无,注释=无,编码=无,方言=无,tupleize_cols =无,error_bad_lines =真,warn_bad_lines =真,skipfooter=0,doublequote =真,delim_空白=假,low_memory =真,memory_map =假,float_precision =无 )
下面给出了一些有用的参数:
下载学生. csv 文件点击此处
方法 1: 读取 csv 文件时,从开始处跳过 N 行。
代码:
蟒蛇 3
# Importing Pandas library
import pandas as pd
# Skipping 2 rows from start in csv
# and initialize it to a dataframe
df = pd.read_csv("students.csv",
skiprows = 2)
# Show the dataframe
df
输出:
方法 2: 读取 csv 文件时跳过特定位置的行。
代码:
蟒蛇 3
# Importing Pandas library
import pandas as pd
# Skipping rows at specific position
df = pd.read_csv("students.csv",
skiprows = [0, 2, 5])
# Show the dataframe
df
输出:
方法 3: 读取 csv 文件时,除列名外,从头开始跳过 N 行。
代码:
蟒蛇 3
# Importing Pandas library
import pandas as pd
# Skipping 2 rows from start
# except the column names
df = pd.read_csv("students.csv",
skiprows = [i for i in range(1, 3) ])
# Show the dataframe
df
输出:
方法 4: 读取 csv 文件时根据条件跳过行。
代码:
蟒蛇 3
# Importing Pandas library
import pandas as pd
# function for checking and
# skipping every 3rd line
def logic(index):
if index % 3 == 0:
return True
return False
# Skipping rows based on a condition
df = pd.read_csv("students.csv",
skiprows = lambda x: logic(x) )
# Show the dataframe
df
输出:
方法 5: 读取 csv 文件时从末尾跳过 N 行。
代码:
蟒蛇 3
# Importing Pandas library
import pandas as pd
# Skipping 2 rows from end
df = pd.read_csv("students.csv",
skipfooter = 5,
engine = 'python')
# Show the dataframe
df
输出: