ljxu 发表于 2012-6-27 00:16:57

_IEDocReadHTML读取的网页源码能否用正则提取

本帖最后由 ljxu 于 2012-6-27 00:18 编辑

$Html = _IEDocReadHTML($oIE)
MsgBox(0,0,$Html,3);网页源代码显示成功
Local $captcha=StringRegExp($Html, 'aps\d+', 4);正则提取cap+若干个数字的字符串
MsgBox(0,0,@error);值为1
MsgBox(0,1,$captcha);值为空

将$Html的内容写入txt,然后用正则表达式aps\d+ 能成功搜索到想要的字符串

以下为想要提取元素所在行的页面源代码(符合正则要求的仅此一行):
<TD class=pt_submit><INPUT id=aps1340723421954 class=subbtn_bg value=" 发 表 " type=submit jQuery17207899863962825824="6"> <SPAN class=subTip>Ctrl+Enter快捷发表</SPAN> </TD></TR></TBODY></TABLE></DIV></FORM></DIV>


有谁知道原因吗?谢谢

风行者 发表于 2012-6-27 01:15:31

目测,正测返回的是数组

ljxu 发表于 2012-6-27 08:51:13

回复 2# 风行者


    _ArrayDisplay($captcha, "111111")出来的值依旧为空。

还能有什么原因呢,大哥?

afan 发表于 2012-6-27 10:06:14

StringRegExp($Html, 'aps\d+', 4) 改为 1

ljxu 发表于 2012-6-27 11:38:18

回复 4# afan


    感谢两位的热心帮助,改为参数修改为1之后,再_ArrayDisplay就能看到想到提取的值了!
   3Q

ljxu 发表于 2012-6-27 11:38:48

回复 2# 风行者


    你的目测很准。。。。。。。。

锋城未逾年 发表于 2023-5-17 22:54:41

谢谢分享,学习下
页: [1]
查看完整版本: _IEDocReadHTML读取的网页源码能否用正则提取