求正则匹配网页中的时间[已解决]
本帖最后由 heroxianf 于 2016-11-11 09:58 编辑很多网页中的文章时间格式是 XXXX-XX-XX XX:XX:XX或者是XXXX-XX-XX XX:XX 或者是 XXXX-XX-XX
一个有秒另外一个没有秒还有只有日期的,不同网站时间也在不同的SPAN之间不是连贯的,正则可以用组匹配后在结合一下呢?
范文
2016-10-28 08:31:12
2016-10-28 08:31
2016-10-28 \d{4}-\d{2}-\d{2}(?:\s[\d:]+)? 回复 2# haijie1223
谢谢海大,关于这种情况如何处理比较好呢?我能想到的就是分开匹配然后 & 一下,但是不够通用。
<span class="pl30 cor_2 fz16">
<span class="mr10">2016-10-28</span>
<span class="mr15">08:31</span>
<span class=""></span> 正则替换 回复 4# haijie1223
正则替换如果只针对这一个格式的话,其他类似网站不同元素装饰的时间是不是不能匹配了? 回复 5# heroxianf
需要把所有的情况都列出来看下才好下定论 回复 6# haijie1223
大体就是每个网站对时间放到那个元素不同的情况了。<span class="pl30 cor_2 fz16">
<span class="xr1">2016-10-28</span>
<span class="xr2">08:31</span>
<span class=""></span>
<span class="">2016-10-28</span>
<span class="">08:31</span>
回复 6# haijie1223
海大,就我发的这篇帖子的时间用这个正则都抓不出来呢,结果是先匹配的我帖子内容的时间,而不是发帖的时间。
页:
[1]