$Html = BinaryToString(InetRead("http://www.wowxunyou.com/"),4)
MsgBox(0,"源码",$Html) 回复 16# 风行者
虽然也不能得到我需要的,但是学习你这样的表达方式 回复 15# afan
太强了 万分感谢
afan 发表于 2011-4-13 20:57 http://www.autoitx.com/images/common/back.gif
A大果然是A大!!佩服佩服
A大的这个例子很值得玩味啊!
其实前面几位已经给出取数据的代码了,但是得到的结果与A大不同,问题就出在那段商品展示的方式上,初始化是它用了一段js代码夹带xmlhttp去服务器取了一段数据,而直接浏览主页代码,或者读取http数据是看不到这些的,所以几位的方法达不到楼主的要求。
但是,嗯哼,但是我发现A大套用_IEDocReadHTML后,情况发生了变化,原本隐藏的数据,尽然完全暴露了!直接填写到html里了,不用post了,_IEDocReadHTML完全代劳了。
实在值得仔细比较下这其中过程与IE.au3的细节 找到了,帮助啊,万能的帮助
#include <IE.au3>
_IEDocReadHTML ( ByRef $o_object )
注意/说明
本函数返回的源代码是经过客户端改动之后的网页的源码(如通过AutoIt或者客户端JavaScript). 因此可能和在浏览器中显示的或通过_INetGetSource得到的源码不一样.
回复 19# bakefish
过奖了~ 你研究得很透彻啊~ 呵呵
我知道LZ的乱码只是小问题,关键是获取不到完整的网页源码~
我曾经也对Js郁闷过,经过一番测试最后使用_IEDocReadHTML()成功~ 之后基本上如果采用其它方法不能完整获取的我都会用此方法。 回复 21# afan
乱码是小问题,什么问题呢 回复 22# love5173
我想一般是网页中指定的编码格式与文件格式不符造成的。你1#的方式修改下即可#include <INet.au3>
$s_URL='http://www.wowxunyou.com/'
$soure = _INetGetSource($s_URL, 0)
Msgbox(0, 0, BinaryToString($soure, 4)) 请问,能否读取IE源码,并识别其中的表单,输出到Excel中使用? 请问,怎么从IE源码中,提取表单部份的html代码保存出来?
提取<form …………………… </form>这部份代码出来 我觉得都是写入文本里面然后提取比较方便 这个好支持你一下
页:
1
[2]