_IEDocReadHTML读取的网页源码能否用正则提取
本帖最后由 ljxu 于 2012-6-27 00:18 编辑$Html = _IEDocReadHTML($oIE)
MsgBox(0,0,$Html,3);网页源代码显示成功
Local $captcha=StringRegExp($Html, 'aps\d+', 4);正则提取cap+若干个数字的字符串
MsgBox(0,0,@error);值为1
MsgBox(0,1,$captcha);值为空
将$Html的内容写入txt,然后用正则表达式aps\d+ 能成功搜索到想要的字符串
以下为想要提取元素所在行的页面源代码(符合正则要求的仅此一行):
<TD class=pt_submit><INPUT id=aps1340723421954 class=subbtn_bg value=" 发 表 " type=submit jQuery17207899863962825824="6"> <SPAN class=subTip>Ctrl+Enter快捷发表</SPAN> </TD></TR></TBODY></TABLE></DIV></FORM></DIV>
有谁知道原因吗?谢谢 目测,正测返回的是数组 回复 2# 风行者
_ArrayDisplay($captcha, "111111")出来的值依旧为空。
还能有什么原因呢,大哥? StringRegExp($Html, 'aps\d+', 4) 改为 1 回复 4# afan
感谢两位的热心帮助,改为参数修改为1之后,再_ArrayDisplay就能看到想到提取的值了!
3Q 回复 2# 风行者
你的目测很准。。。。。。。。 谢谢分享,学习下
页:
[1]