找回密码
 加入
搜索
查看: 2160|回复: 7

[效率算法] 求正则匹配网页中的时间[已解决]

  [复制链接]
发表于 2016-11-7 17:16:31 | 显示全部楼层 |阅读模式
本帖最后由 heroxianf 于 2016-11-11 09:58 编辑

很多网页中的文章时间格式是    XXXX-XX-XX XX:XX:XX  或者是  XXXX-XX-XX XX:XX 或者是 XXXX-XX-XX
一个有秒另外一个没有秒还有只有日期的,不同网站时间也在不同的SPAN之间不是连贯的,正则可以用组匹配后在结合一下呢?

范文
2016-10-28 08:31:12
2016-10-28 08:31
2016-10-28
发表于 2016-11-7 18:21:38 | 显示全部楼层
\d{4}-\d{2}-\d{2}(?:\s[\d:]+)?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
 楼主| 发表于 2016-11-7 20:11:15 | 显示全部楼层
回复 2# haijie1223


    谢谢海大,关于这种情况如何处理比较好呢?我能想到的就是分开匹配然后 & 一下,但是不够通用。
<span class="pl30 cor_2 fz16">
<span class="mr10">2016-10-28</span>
<span class="mr15">08:31</span>
<span class=""></span>
发表于 2016-11-7 21:39:39 | 显示全部楼层
正则替换
 楼主| 发表于 2016-11-7 22:52:33 | 显示全部楼层
回复 4# haijie1223


    正则替换如果只针对这一个格式的话,其他类似网站不同元素装饰的时间是不是不能匹配了?
发表于 2016-11-7 23:49:19 | 显示全部楼层
回复 5# heroxianf


    需要把所有的情况都列出来看下才好下定论
 楼主| 发表于 2016-11-8 22:34:38 | 显示全部楼层
回复 6# haijie1223

大体就是每个网站对时间放到那个元素不同的情况了。
<span class="pl30 cor_2 fz16">
<span class="xr1">2016-10-28</span>
<span class="xr2">08:31</span>
<span class=""></span>

<span class="">2016-10-28</span>
<span class="">08:31</span>
 楼主| 发表于 2016-11-9 22:07:26 | 显示全部楼层
回复 6# haijie1223

海大,就我发的这篇帖子的时间用这个正则都抓不出来呢,结果是先匹配的我帖子内容的时间,而不是发帖的时间。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-12-22 14:36 , Processed in 0.317844 second(s), 24 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表