heroxianf 发表于 2016-11-7 17:16:31

求正则匹配网页中的时间[已解决]

本帖最后由 heroxianf 于 2016-11-11 09:58 编辑

很多网页中的文章时间格式是    XXXX-XX-XX XX:XX:XX或者是XXXX-XX-XX XX:XX 或者是 XXXX-XX-XX
一个有秒另外一个没有秒还有只有日期的,不同网站时间也在不同的SPAN之间不是连贯的,正则可以用组匹配后在结合一下呢?

范文
2016-10-28 08:31:12
2016-10-28 08:31
2016-10-28

haijie1223 发表于 2016-11-7 18:21:38

\d{4}-\d{2}-\d{2}(?:\s[\d:]+)?

heroxianf 发表于 2016-11-7 20:11:15

回复 2# haijie1223


    谢谢海大,关于这种情况如何处理比较好呢?我能想到的就是分开匹配然后 & 一下,但是不够通用。
<span class="pl30 cor_2 fz16">
<span class="mr10">2016-10-28</span>
<span class="mr15">08:31</span>
<span class=""></span>

haijie1223 发表于 2016-11-7 21:39:39

正则替换

heroxianf 发表于 2016-11-7 22:52:33

回复 4# haijie1223


    正则替换如果只针对这一个格式的话,其他类似网站不同元素装饰的时间是不是不能匹配了?

haijie1223 发表于 2016-11-7 23:49:19

回复 5# heroxianf


    需要把所有的情况都列出来看下才好下定论

heroxianf 发表于 2016-11-8 22:34:38

回复 6# haijie1223

大体就是每个网站对时间放到那个元素不同的情况了。<span class="pl30 cor_2 fz16">
<span class="xr1">2016-10-28</span>
<span class="xr2">08:31</span>
<span class=""></span>

<span class="">2016-10-28</span>
<span class="">08:31</span>

heroxianf 发表于 2016-11-9 22:07:26

回复 6# haijie1223

海大,就我发的这篇帖子的时间用这个正则都抓不出来呢,结果是先匹配的我帖子内容的时间,而不是发帖的时间。

页: [1]
查看完整版本: 求正则匹配网页中的时间[已解决]