[求助]请帮忙用正则提取网址
本帖最后由 vv3509 于 2010-12-7 10:45 编辑网页源代码:
<a href="http://jue-ce.com/forum.php?mod=attachment&aid=MTk1Nnw0ZmRlYjk4N3wxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财内线1207早盘.pdf</a><em class="xg1"><a href="http://jue-ce.com/forum.php?mod=attachment&aid=MTk1OHwzMGQ0MThkZXwxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财1206盘后.pdf</a>
<em class="xg1">红色部分会变更,请帮忙用正则提取网址
中财内线1207早盘.pdf http://jue-ce.com/forum.php?mod=attachment&aid=MTk1Nnw0ZmRlYjk4N3wxMjkxNjg4NDkzfDE1MzQ%3D
中财1206盘后.pdf http://jue-ce.com/forum.php?mod=attachment&aid=MTk1OHwzMGQ0MThkZXwxMjkxNjg4NDkzfDE1MzQ%3D 本帖最后由 shenrenba 于 2010-12-7 10:47 编辑
(?s)href="([^"]*).+?>([^<]*) 谢谢 最好把文件名提出来 <a href\="http\:\/\/(.+?)\target\="\_blank"\>(+?)<\/a>这是ASP的正则表达式,不知道AU3是不是这样写。手机上的,不方便打字。 $s = '<a href="http://jue-ce.com/forum.php?mod=attachment&aid=MTk1Nnw0ZmRlYjk4N3wxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财内线1207早盘.pdf</a><em class="xg1"><a href="http://jue-ce.com/forum.php?mod=attachment&aid=MTk1OHwzMGQ0MThkZXwxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财1206盘后.pdf</a>' & _
'<em class="xg1">'
Local $string
$st = StringRegExp($s,'href=\"(.+?)\".+?>(.+?pdf)',3)
For $i = 1 To UBound($st) Step 2
$string &= $st[$i] &@TAB & $st[$i-1]&@CRLF
Next
MsgBox(0,"",$string)比如这样? 很简单的东西,自己多练练吧(http:\H+)".+?>([^<]+)
页:
[1]