找回密码
 加入
搜索
查看: 2191|回复: 6

[AU3基础] _IEDocReadHTML读取的网页源码能否用正则提取

  [复制链接]
发表于 2012-6-27 00:16:57 | 显示全部楼层 |阅读模式
本帖最后由 ljxu 于 2012-6-27 00:18 编辑

$Html = _IEDocReadHTML($oIE)
MsgBox(0,0,$Html,3);网页源代码显示成功
Local $captcha=StringRegExp($Html, 'aps\d+', 4);正则提取cap+若干个数字的字符串
MsgBox(0,0,@error);值为1
MsgBox(0,1,$captcha);值为空

将$Html的内容写入txt,然后用正则表达式  aps\d+ 能成功搜索到想要的字符串

以下为想要提取元素所在行的页面源代码(符合正则要求的仅此一行):
<TD class=pt_submit><INPUT id=aps1340723421954 class=subbtn_bg value=" 发 表 " type=submit jQuery17207899863962825824="6"> <SPAN class=subTip>Ctrl+Enter快捷发表</SPAN> </TD></TR></TBODY></TABLE></DIV></FORM></DIV>


有谁知道原因吗?谢谢

评分

参与人数 1威望 -5 金钱 -20 收起 理由
afan -5 -20 乱发版

查看全部评分

发表于 2012-6-27 01:15:31 | 显示全部楼层
目测,正测返回的是数组
 楼主| 发表于 2012-6-27 08:51:13 | 显示全部楼层
回复 2# 风行者


    _ArrayDisplay($captcha, "111111")出来的值依旧为空。

还能有什么原因呢,大哥?
发表于 2012-6-27 10:06:14 | 显示全部楼层
StringRegExp($Html, 'aps\d+', 4) 改为 1
 楼主| 发表于 2012-6-27 11:38:18 | 显示全部楼层
回复 4# afan


    感谢两位的热心帮助,改为参数修改为1之后,再_ArrayDisplay就能看到想到提取的值了!
   3Q
 楼主| 发表于 2012-6-27 11:38:48 | 显示全部楼层
回复 2# 风行者


    你的目测很准。。。。。。。。
发表于 2023-5-17 22:54:41 | 显示全部楼层
谢谢分享,学习下
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-11-15 07:15 , Processed in 0.077668 second(s), 24 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表