wokao98 发表于 2011-12-21 07:36:38

《已解决》求一个能在<tr><td>之间提取出相关数据的正则,谢谢。

本帖最后由 wokao98 于 2011-12-21 13:23 编辑

<tr>
    <td width=20 class="Event5000">&nbsp;</td>
    <td class="Event5000" width="125">2011-12-20 20:39</td>
    <td class="Event5000" width="19"><img src="/sdsawn/images/Event-5000.gif" border="0"></td>
    <td class="Event5000"><a href="/sdwaon/view.asp?view=Insadwqasq32778">AAAAAAAAAABBBBBBBCCCCCDDDDD.</a>&nbsp;</td>
</tr>
<tr>
    <td width=20 class="Event5000">&nbsp;</td>
    <td class="Event5000" width="125">2011-12-20 20:39</td>
    <td class="Event5000" width="19"><img src="/sdsawn/images/Event-5000.gif" border="0"></td>
    <td class="Event5000"><a href="/sdwaon/view.asp?view=Insadwqasq32778">eeeeffffhhhhggggffffff.</a>&nbsp;</td>
</tr>
这种每行都重复格式的代码,请问下能否做到提取出时间 2011-12-20 20:39   和超链接 <a href="/sdwaon/view.asp?view=Insadwqasq32778"> 还有 内容 AAAAAAAAAABBBBBBBCCCCCDDDDD. 呢?
我后续想把这三个数据重新构造成新的HTML,能否提取出来的时候再中间加个特殊的分隔符,以便后续能使用StringSplit 来截取呢?
不好意思,小弟刚学正则没多久,不知道思路是否正确,各位见谅。

64202171 发表于 2011-12-21 08:47:54

关注谢谢了

user3000 发表于 2011-12-21 09:31:26

这种每行都重复格式的代码,请问下能否做到提取出时间 2011-12-20 20:39   和超链接还有 内容 AAAAAAAA ...
wokao98 发表于 2011-12-21 07:36 http://www.autoitx.com/images/common/back.gif

#include <array.au3>
Local $text = FileRead(FileOpen ('d:\666.txt'))
MsgBox (0, '原文本', $text)
Local $date = StringRegExp($text, '\d{4}-\d{1,2}-\d{1,2}\h+\d{1,2}:\d{1,2}', 3)
_arraydisplay($date, '匹配的日期')

Local $http = StringRegExp($text, '<a[^>]+?>', 3)
_arraydisplay($http, '匹配的网址')

Local $content = StringRegExp($text, '<a[^>]+>([^<]+)</a>', 3)
_arraydisplay($content, '匹配的内容')
666.txt 就是你发出的代码的文本内容
建议你花三到五天的时间学习一下正则的基本运用...
不要给正则的多样化吓倒了,
老实说, 我就是这样学了几天, 基本的运用, 还是勉强作得来的,
当然, 很多时候还是翻着帮助做出来的.

Ycxw2008 发表于 2011-12-21 11:37:24

那只能说 楼主你的工程太伟大了,你不如直接正则替换掉html代码{:face (200):}

wokao98 发表于 2011-12-21 13:22:14

谢谢 user3000 的帮助,实在太完美了。。
我把帖子结掉吧
直接替换掉HTML,对于我新手来说工程更伟大呢。
页: [1]
查看完整版本: 《已解决》求一个能在<tr><td>之间提取出相关数据的正则,谢谢。