《已解决》求一个能在<tr><td>之间提取出相关数据的正则,谢谢。
本帖最后由 wokao98 于 2011-12-21 13:23 编辑<tr>
<td width=20 class="Event5000"> </td>
<td class="Event5000" width="125">2011-12-20 20:39</td>
<td class="Event5000" width="19"><img src="/sdsawn/images/Event-5000.gif" border="0"></td>
<td class="Event5000"><a href="/sdwaon/view.asp?view=Insadwqasq32778">AAAAAAAAAABBBBBBBCCCCCDDDDD.</a> </td>
</tr>
<tr>
<td width=20 class="Event5000"> </td>
<td class="Event5000" width="125">2011-12-20 20:39</td>
<td class="Event5000" width="19"><img src="/sdsawn/images/Event-5000.gif" border="0"></td>
<td class="Event5000"><a href="/sdwaon/view.asp?view=Insadwqasq32778">eeeeffffhhhhggggffffff.</a> </td>
</tr>
这种每行都重复格式的代码,请问下能否做到提取出时间 2011-12-20 20:39 和超链接 <a href="/sdwaon/view.asp?view=Insadwqasq32778"> 还有 内容 AAAAAAAAAABBBBBBBCCCCCDDDDD. 呢?
我后续想把这三个数据重新构造成新的HTML,能否提取出来的时候再中间加个特殊的分隔符,以便后续能使用StringSplit 来截取呢?
不好意思,小弟刚学正则没多久,不知道思路是否正确,各位见谅。 关注谢谢了 这种每行都重复格式的代码,请问下能否做到提取出时间 2011-12-20 20:39 和超链接还有 内容 AAAAAAAA ...
wokao98 发表于 2011-12-21 07:36 http://www.autoitx.com/images/common/back.gif
#include <array.au3>
Local $text = FileRead(FileOpen ('d:\666.txt'))
MsgBox (0, '原文本', $text)
Local $date = StringRegExp($text, '\d{4}-\d{1,2}-\d{1,2}\h+\d{1,2}:\d{1,2}', 3)
_arraydisplay($date, '匹配的日期')
Local $http = StringRegExp($text, '<a[^>]+?>', 3)
_arraydisplay($http, '匹配的网址')
Local $content = StringRegExp($text, '<a[^>]+>([^<]+)</a>', 3)
_arraydisplay($content, '匹配的内容')
666.txt 就是你发出的代码的文本内容
建议你花三到五天的时间学习一下正则的基本运用...
不要给正则的多样化吓倒了,
老实说, 我就是这样学了几天, 基本的运用, 还是勉强作得来的,
当然, 很多时候还是翻着帮助做出来的. 那只能说 楼主你的工程太伟大了,你不如直接正则替换掉html代码{:face (200):} 谢谢 user3000 的帮助,实在太完美了。。
我把帖子结掉吧
直接替换掉HTML,对于我新手来说工程更伟大呢。
页:
[1]