pandas的to_datetime时间转换使用及学习心得

脚本专栏 2026/1/17 佚名

3 2 1

明霞山资源网 Design By www.htccd.com

前言

昨天在网赛中做了一道题，虽然是外国人的Englis题目，但是内容很有学习的价值，值得仔细的学习，今天就把我所收获的一部分记录下来。其一：做个学习的资料记录。其二：分享出来，供大家参考。

（收获了对处理大数据的又一次认识！！！）

这是一道将DataFrame的日期数据转换为python能认识的题目。这里重点讲一下to_datetime的部分使用。

首先说一下：

1/17/07 has the format "%m/%d/%y"
17-1-2007 has the format "%d-%m-%Y"

这是一部分的时间转换格式，通过以上的格式，你可以将DataFrame中的时间格式转换为以下等python格式：

0 2007-03-02
1 2007-03-22
2 2007-04-06
3 2007-04-14
4 2007-04-15
Name: date_parsed, dtype: datetime64[ns]

看见没有dtype:datetime64，这是转换过后的形式，其实你可以将原数据使用dtype查看列，来看它的格式。你会发现它是object形式的。这里说一下。这个object格式一般是python用来记录可变化的兑现的格式。这个格式它并不能认出是时间格式，尽管我们一眼就能看出（人和机器的区别在此）。

data = pd.read_csv('path') #这里我们得到data数据
data['date'].heade() #查看一下日期列的样子

0 01/02/1965
1 01/04/1965
2 01/05/1965
3 01/08/1965
4 01/09/1965
Name: Date, dtype: object

可以看出它为object格式，并非日期格式。

data['date_parsed'] = pd.to_datetime(data['date'],format="%m/%d/%y")

上面为我们按python格式转换时间，并添加到新的一列中去。

dara['date_parsed'].head()  #查看一下结果

0  1965-01-02
1  1965-01-04
2  1965-01-05
3  1965-01-08
4  1965-01-09
 
Name: data_parsed, dtype: datetime64[ns]

可以看到不论形式还是类型都改变了，当然这只是一点皮毛，如果只是这里点，这个博客意义不大

其实在使用上面语句转换时间是，并不是这么顺利：

/opt/conda/lib/python3.6/site-packages/pandas/core/tools/datetimes.py in _convert_listlike(arg, box, format, name, tz)
  271           try:
  272             result = array_strptime(arg, format, exact=exact,
--> 273                         errors=errors)
  274           except tslib.OutOfBoundsDatetime:
  275             if errors == 'raise':
 
pandas/_libs/tslibs/strptime.pyx in pandas._libs.tslibs.strptime.array_strptime()
 
ValueError: time data '1975-02-23T02:58:41.000Z' does not match format '%m/%d/%Y' (match)

一部分错误信息如上。

面对加载都要加载半天的数据出了错误，你真的是无助的，如果要去看数据怕是要看一天。

当然有人会说不是有错误信息吗？当然我知道，但是一但当信息量大了以后，当时是茫然的。花了半天查找其他时间的转换方式。无果。于是静下心来发现问题。可以看出它说有一下格式不能转换。

'1975-02-23T02:58:41.000Z'

所以我又换了一种格式将时分秒都匹配了，又提醒年月日不匹配。反复的验证后发现应该是原数据有问题，部分时间并不是同意的格式。哈哈发现问题了，我们可以修改了。

我第一次的修改方式为：

data['over_long'] = data['Date'].apply(len)  #添加一列记录没行时间的长度
data.loc[data['over_long'] > 10]  #输出大于正常数据的行  这里会发现缺失有那么几行在作怪！！！

normal_dates = data.loc[data['over_long'] < 11]  #筛选出正常数据
normal_dates = normal_dates.copy()    #拷贝
normal_dates['data_parsed'] = pd.to_datetime(normal_dates['Date'],format='%m/%d/%Y')  #再次转换时间，发现没有报错了 哈哈
normal_dates['data_parsed'].head(10)  #输出查看没问题的

以上是我的第一次解决方法。

后续在别人的指导下了解了其他的几种更好的方法。（毕竟我删除数据的方式不好）

第一种和第二种：

data['date_parsed'] = pd.to_datetime(data['Date'], format = "%m/%d/%Y", errors = 'coerce')

data['date_parsed'] = pd.to_datetime(data['Date'],infer_datetime_format=True)

两个都能实现我试了一下。毕竟对to_datetime不太熟悉所以犯了错。

OK！全部完成了。但是我想说的以上都不是最重要的。

最重要的是一种经验的掌握。当你面对大量的数据时千万不要紧张，它们也是小数据构成的，只要冷静下来，你就能想到方法来解决。这才是我想说的！！！与君共勉。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对的支持。

pandas,to_datetime时间转换

标签：

pandas,to_datetime时间转换

明霞山资源网 Design By www.htccd.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

明霞山资源网 Design By www.htccd.com

评论“pandas的to_datetime时间转换使用及学习心得”

暂无评论...

www.htccd.com 明霞山资源网

139,976互联网资源

144,792高清电影

21,817无损音乐

631,128技术资源

最新文章

群星《奔赴！万人现场第2期》[FLAC/分轨][5

2026/1/17

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2026/1/17

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2026/1/17

【古典音乐】詹姆斯·高威《季节》1993[WAV+

2026/1/17

贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]

2026/1/17

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2026/1/17

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

pandas的to_datetime时间转换使用及学习心得

pandas,to_datetime时间转换

Python测试模块doctest使用解析

Django发送邮件和itsdangerous模块的配合使用解析

评论“pandas的to_datetime时间转换使用及学习心得”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

友情链接

pandas的to_datetime时间转换使用及学习心得

pandas,to_datetime时间转换

Python测试模块doctest使用解析

Django发送邮件和itsdangerous模块的配合使用解析

评论“pandas的to_datetime时间转换使用及学习心得”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存