c

codeye

V1

2022/09/22阅读:11主题:默认主题

日期时间

Python进行数据分析时,按照日期进行分组汇总也是被需要的,比如判断某月某日是星期几,依据此推断是否为工作日等;

从指定的日期当中获取星期几。比如2022年9月18日,星期日,这一天商场的顾客到访和成就都会比工作日期间要多。

本文就以2022-09-18为例,演示Python获取指定日期是“星期几”的6种方法!

第1种方法 导入dateutil.parser

解析器模块可以解析更多格式的日期时间字符串。 没有比 dateutil 更好的库来解析 Python 中的日期和时间了。为了查询时区,tz 模块提供了一切。当这些模块结合在一起的时候,它们使解析字符串成为具有时区意识的日期时间对象变得非常容易。

安装 : dateutil可以用pip或easy_install来安装,即sudo pip install dateutil==2.0或sudo easy_install dateutil==2.0。需要2.0版本以兼容Python 3。完整的文档可以在 http://labix.org/python-dateutil 找到。

from dateutil.parser import parse
def day_of_week(date):
    return parse(date, dayfirst=True).strftime("%A")

优势明显!兼容

输入不同的日期格式,几种常见的顺序都正常输出

#输入不同的日期格式
print(parser.parse('9 - 18 - 2022'))
print(parser.parse('2022-9-18'))
print(parser.parse('18-9-2022'))
print(parser.parse('Sun Sep 18 13:42:28 2022'))
#print(parser.parse('Sunday/ 18 September/ 2022 13:42PM'))
print(parser.parse('9 / 18 / 2022 13:42:28'))
print(parser.parse('9 / 18 / 2022'))
print(parser.parse('2022-09-25T13:42:28Z'))

输出效果

2022-09-18 00:00:00
2022-09-18 00:00:00
2022-09-18 00:00:00
2022-09-18 13:42:28
2022-09-18 13:42:28
2022-09-18 00:00:00
2022-09-25 13:42:28+00:00

只需要导入解析器模块,用一个日期时间字符串调用parse()函数。解析器可以返回一个合理的日期时间对象,但它不能解析字符串,它将引发ValueError。 它是如何工作的。

解析器不是寻找可识别的标记,而是猜测这些标记指的是什么。它不使用正则表达式。 这些标记的顺序很重要,因为它使用的日期格式看起来像月/日/年(默认顺序),而其他的则使用日/月/年的格式。

parse()函数需要一个可选的关键字参数,dayfirst,它默认为False来处理这个问题。 如果设置为 True,它可以正确地解析后一种格式的日期。

这些标记的顺序很重要,因为它使用的日期格式看起来像月/日/年(默认顺序),而其他的则使用日/月/年的格式。

parse()函数需要一个可选的关键字参数,dayfirst,它默认为False来处理这个问题。 如果它被设置为 True,它可以正确地解析后一种格式的日期。

parser.parse('16 / 6/2022', dayfirst = True)

输出:

datetime.datetime(2022, 6, 16, 0, 0)

另一个排序问题可能发生在两位数的年份上。但'11-6-19′是一个模糊的日期格式。由于dateutil默认为月-日-年的格式,'11-6-19′被解析为2019年。但是如果将yearfirst = True传入parse(),它可以被解析为2011年。

print (parser.parse('11-6-19'))
print (parser.parse('10-6-25', yearfirst = True))

2019-11-06 00:00:00
2010-06-25 00:00:00

输出:

2019-11-06 00:00:00
2010-06-25 00:00:00

dateutil解析器还可以进行模糊解析,并允许忽略日期时间字符串中不相干的字符。当遇到未知的标记时,parse()会引发ValueError,默认值为False。如果fuzzy = True,通常可以返回一个日期时间对象。

第2种方法 weekday() datetime模块是一个Python内置库,无需再进行pip安装,它除了可以显示日期和时间之外,还可以进行日期和时间的运算以及格式化。 datetime模块中的方法weekday()可用于检索星期几,结果返回0-6之间的整数,用来代表“星期一”到“星期日”。 在交互式环境中输入如下命令:

from datetime import datetime
datetime.date(2022, 9, 18).weekday()

输出: 在代码中,datetime模块会先将由年、月和日组成的日期转换为datetime日期。然后weekday()方法获取“2022-09-18”这天是星期日。

但是根据我们国内的习惯,总不能直接输出1吧。所以我们可以先自定义一个包含中文“星期几”的列表,再通过索引的方式来返回一个中文的星期几。

输入如下命令:

week_cn = ["星期一","星期二","星期三","星期四","星期五","星期六","星期日"]
week_cn[datetime.date(2022, 9, 18).weekday()]

输出:'星期二'

第3种方法 isisoweekday() isoweekday()方法与前一个weekday()方法的工作原理类似,最大的区别是它返回1-7之间的整数,用来代表“星期一”到“星期日”。 在交互式环境中输入如下命令:

import datetime
datetime.date(2022, 9, 18).isoweekday()

7

输出:7 这次输出的结果7,对应于“星期日”了。

第 4 种方法 strftime() 如果你想直接输出日期的英文周名,不妨试试strftime()方法。 利用strftime()方法可以将datetime对象显示为字符串。我们其实对日期格式转化为字符串格式非常熟悉,比如strftime('%b-%m-%y %H:%M:%S'),只需将其中的指令改为%A,即可得到日期是星期几。 在交互式环境中输入如下命令:

import datetime
datetime.date(2022, 9, 18).strftime("%A")

输出:'Sunday'

如果将代码中的%A改为%a,则输出的是星期几的简写。 datetime.date(2022, 9, 18).strftime("%a")

输出:'Sun'

第 5 种 calendar 在Python中calendar日历模块也是一个内置库,为我们对日历做处理提供了很多方法,使用起来非常方便,我们可以使用它制作日历/周历等等。同样,它也提供了weekday()和day_name()方法来查询指定日期是星期几。 在交互式环境中输入如下命令:

import calendar
calendar.weekday(2022, 9, 18)

6

输出:6

注意:calendar输出不是 7 是 6!

这与前文第一个方法的datetime模块weekday()方法是一模一样的。 如果你想直接输出日期的英文周名,calendar日历模块也有方法可以实现。

import datetime
import calendar
date_week = datetime.date(2022, 9, 18).weekday()
day_name_en = ["Monday","Tuesday","Wednesday","Thursday","Friday","Saturday","Sunday"]

print(calendar.day_name[date_week])

输出:'Sunday'

import datetime
import calendar
date_week = datetime.date(2022, 9, 18).weekday()
day_name = ["星期一""星期二""星期三"
"星期四""星期五""星期六""星期日"]
print(day_name[date_week])

输出:'星期日'

第 6 种 pendulum datetime模块也有一些限制,比如处理时区问题等等。而pendulum模块是这个第三方开源库,可以解决内置datetime模块的所有问题。

​ ​https://pypi.org/project/pendulum/ ​ ​ 当然,它也有方法可以输出指定日期是星期几。 在交互式环境中输入如下命令:

import pendulum
pendulum.parse('2022-09-18').day_of_week

第 7 种 pandas

import pandas as pd
from datetime import datetime
df = pd.DataFrame({
    "date": [datetime(2022, 9, 18), 
             datetime(2022, 10, 1), 
             datetime(2022, 12 , 25),
            datetime(2022, 12 , 25)]

                })
df

输出 df

 date
0 2022-09-18
1 2022-10-01
2 2022-12-25

日期->星期

df["week_num1"] = df["date"].dt.dayofweek
df["week_num2"] = df["date"].dt.weekday
df["week_name"] = df["date"].dt.day_name()
df

输出

 date week_num1 week_num2 week_name
0 2022-09-18 6 6 Sunday
1 2022-10-01 5 5 Saturday
2 2022-12-25 6 6 Sunday

它将接受格式为"(YYYY, MM, DD, HH, MM, SS)"的日期时间输入,其中。

YYYY代表年份 MM代表月份 DD代表日期 HH代表小时 MM代表分钟 SS代表秒 我们首先需要导入DateTime模块并创建一个DateTime,现在使用weekday()函数我们将得到一个特定DateTime的工作日。

使用Pandas库 这里我们将使用pandas.to_datetime()方法来解析包含纳秒的DateTime字符串。

语法:

pandas.to_datetime(arg, errors='raise', dayfirst=False, yearfirst=False, utc=None, box=True, format=None, exact=True, unit=None, infer_datetime_format=False, origin='unix', cache=False)

参数:

arg: 一个整数、字符串、浮点数、列表或dict对象,用于转换为Date时间对象。 dayfirst: 布尔值,如果为真,则将日期放在前面。 yearfirst: 布尔值,如果为真,则将年放在前面。 utc。布尔值,如果为真,则以UTC为单位返回时间。 format(格式)字符串输入,告诉日、月、年的位置。

import pandas as pd
  
# Parse the timestamp string by
# providing the format of timestamp string
dt_obj = pd.to_datetime("2021-08-05 15:25:56.792554"
                        format="%Y-%m-%d %H:%M:%S.%f")
  
# Verify the value for nano seconds
nano_secs = dt_obj.strftime("%f")
  
# Print the value of nano seconds
print(nano_secs)

Output:

792554

下面的例子与前面的例子类似,只是我们使用了pandas库而不是datetime模块。当我们在使用pandas数据框架时,这可以证明是很方便的。这个库的一个好处是,我们可能不需要手动提供格式。pandas.to_datetime()方法中的参数infer_datetime_format如果提供为True,就可以自动处理这个问题。在某些情况下,它可以将解析速度提高~5-10倍。下面是一个同样的例子。


import pandas as pd
  
# Parse the timestamp string by
# providing infer_datetime_format as True
dt_obj = pd.to_datetime("2021-08-05 15:25:56.792554"
                        infer_datetime_format=True)
  
# Verify the value for nano seconds
nano_secs = dt_obj.strftime("%f")
  
# Print the value of nano seconds
print(nano_secs)

Output:792554

分类:

后端

标签:

后端

作者介绍

c
codeye
V1