vv3509 发表于 2010-12-7 10:33:19

[求助]请帮忙用正则提取网址

本帖最后由 vv3509 于 2010-12-7 10:45 编辑

网页源代码:
<a href="http://jue-ce.com/forum.php?mod=attachment&amp;aid=MTk1Nnw0ZmRlYjk4N3wxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财内线1207早盘.pdf</a><em class="xg1"><a href="http://jue-ce.com/forum.php?mod=attachment&amp;aid=MTk1OHwzMGQ0MThkZXwxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财1206盘后.pdf</a>

<em class="xg1">红色部分会变更,请帮忙用正则提取网址
中财内线1207早盘.pdf    http://jue-ce.com/forum.php?mod=attachment&aid=MTk1Nnw0ZmRlYjk4N3wxMjkxNjg4NDkzfDE1MzQ%3D
中财1206盘后.pdf          http://jue-ce.com/forum.php?mod=attachment&aid=MTk1OHwzMGQ0MThkZXwxMjkxNjg4NDkzfDE1MzQ%3D

shenrenba 发表于 2010-12-7 10:43:41

本帖最后由 shenrenba 于 2010-12-7 10:47 编辑

(?s)href="([^"]*).+?>([^<]*)

vv3509 发表于 2010-12-7 10:45:57

谢谢 最好把文件名提出来

83265358 发表于 2010-12-7 10:52:39

<a href\="http\:\/\/(.+?)\target\="\_blank"\>(+?)<\/a> 这是ASP的正则表达式,不知道AU3是不是这样写。手机上的,不方便打字。

Ziya 发表于 2010-12-7 11:44:20

$s = '<a href="http://jue-ce.com/forum.php?mod=attachment&amp;aid=MTk1Nnw0ZmRlYjk4N3wxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财内线1207早盘.pdf</a><em class="xg1"><a href="http://jue-ce.com/forum.php?mod=attachment&amp;aid=MTk1OHwzMGQ0MThkZXwxMjkxNjg4NDkzfDE1MzQ%3D" target="_blank">中财1206盘后.pdf</a>' & _
        '<em class="xg1">'
Local $string
$st = StringRegExp($s,'href=\"(.+?)\".+?>(.+?pdf)',3)

For $i = 1 To UBound($st) Step 2
        $string &= $st[$i] &@TAB & $st[$i-1]&@CRLF
Next
MsgBox(0,"",$string)比如这样?

afan 发表于 2010-12-7 11:54:46

很简单的东西,自己多练练吧(http:\H+)".+?>([^<]+)
页: [1]
查看完整版本: [求助]请帮忙用正则提取网址