跳转至

在两个日期之间选择熊猫数据框行

原文:https://www.geesforgeks.org/select-pandas-data frame-row-inter-two-date/

先决条件:T2】熊猫

熊猫 是建立在 NumPy 库之上的开源库。它是一个 Python 包,提供了各种数据结构和操作来操作数字数据和时间序列。它主要是流行的,因为导入和分析数据容易得多。熊猫速度快,对用户来说具有高性能&生产力。

本文着重于获取两个日期之间的选定熊猫数据框行。我们可以通过使用过滤器来做到这一点。

日期最初可以用几种方式表示:

  • 线
  • np.日期时间 64
  • datetime.datetime

为了操作熊猫中的日期,我们在熊猫中使用 pd.to_datetime()函数将不同的日期表示转换为 datetime64[ns]格式。

语法: pandas.to_datetime(arg,errors='raise ',dayfirst=False,yearfirst=False,utc=None,box=True,format=None,exact=True,unit=None,infer_datetime_format = False,origin='unix ',cache=False)

参数:

  • 参数:要转换为日期时间对象的整数、字符串、浮点、列表或字典对象。
  • 第一天:布尔值,如果为真,则将第一天置于第一位。
  • 年第一:布尔值,如果为真,则将年放在第一位。
  • 世界协调时:布尔值,如果为真,则返回以世界协调时为单位的时间。
  • 格式:字符串输入,告诉日、月、年的位置。

方法

  • 导入模块
  • 创建或加载数据
  • 创建数据框
  • 将“日期”列转换为 datetime64[ns]数据类型
  • 定义开始日期和结束日期。
  • 使用过滤器显示并存储更新的数据帧。
  • 显示数据框

示例:原始数据帧

蟒蛇 3

import pandas as pd
data = {'Name': ['Tani', 'Saumya',
                 'Ganesh', 'Kirti'],

        'Articles': [5, 3, 4, 3],

        'Location': ['Kanpur', 'Kolkata',
                     'Kolkata', 'Bombay'],
        'Dates': ['2020-08-04', '2020-08-07', '2020-08-08', '2020-06-08']}

# Create DataFrame
df = pd.DataFrame(data)
display(df)

输出:

示例:选择两行之间的数据帧行

蟒蛇 3

import pandas as pd
data = {'Name': ['Tani', 'Saumya',
                 'Ganesh', 'Kirti'],

        'Articles': [5, 3, 4, 3],

        'Location': ['Kanpur', 'Kolkata',
                     'Kolkata', 'Bombay'],
        'Dates': ['2020-08-04', '2020-08-07', '2020-08-08', '2020-06-08']}

# Create DataFrame
df = pd.DataFrame(data)
start_date = '2020-08-05'
end_date = '2020-08-08'
mask = (df['Dates'] > start_date) & (df['Dates'] <= end_date)

df = df.loc[mask]
display(df)

输出:



回到顶部