006001 发表于 2012-9-25 20:09:24

请教个网页正则

本帖最后由 006001 于 2012-9-25 20:11 编辑

<html>
<title>标题</title>
<body>
网页正文内容
</body>
</html>
我想请教一下如何获取body间的内容正文,有时body间的文字会改变,但可以直接通过au3获取其内容,这个网页是通过一个网址访问的,比如www.xxxx.com/1.html,谢谢帮助我的人。

xms77 发表于 2012-9-25 21:03:41

$text = "<html>"&@CRLF _
      &"<title>标题</title>"&@CRLF _
                &"<body>"&@CRLF _
      &"1网页正文内容"&@CRLF _
                &"21312"&@CRLF _
                &"dfadsf</body>"&@CRLF _
                &"</html>"
$Body = StringRegExp($text,'(?s)<body>(.*)</body>',3)
If Not @error Then MsgBox(0,"All text in <body></body>",$Body)
回复 1# 006001

006001 发表于 2012-9-26 07:33:10

回复 2# xms77


    非常感谢。

shqf 发表于 2012-9-26 13:34:51

也可用函数_IEBodyReadHTML()
页: [1]
查看完整版本: 请教个网页正则