风行者 发表于 2011-4-13 20:57:13

只是编码问题
$Html = BinaryToString(InetRead("http://www.wowxunyou.com/"),4)
MsgBox(0,"源码",$Html)

love5173 发表于 2011-4-13 21:39:10

回复 16# 风行者
虽然也不能得到我需要的,但是学习你这样的表达方式

love5173 发表于 2011-4-13 21:48:16

回复 15# afan
太强了 万分感谢

bakefish 发表于 2011-4-13 22:07:32


afan 发表于 2011-4-13 20:57 http://www.autoitx.com/images/common/back.gif


    A大果然是A大!!佩服佩服
A大的这个例子很值得玩味啊!
其实前面几位已经给出取数据的代码了,但是得到的结果与A大不同,问题就出在那段商品展示的方式上,初始化是它用了一段js代码夹带xmlhttp去服务器取了一段数据,而直接浏览主页代码,或者读取http数据是看不到这些的,所以几位的方法达不到楼主的要求。
   但是,嗯哼,但是我发现A大套用_IEDocReadHTML后,情况发生了变化,原本隐藏的数据,尽然完全暴露了!直接填写到html里了,不用post了,_IEDocReadHTML完全代劳了。
   实在值得仔细比较下这其中过程与IE.au3的细节

bakefish 发表于 2011-4-13 22:21:40

找到了,帮助啊,万能的帮助
#include <IE.au3>
_IEDocReadHTML ( ByRef $o_object )

注意/说明
本函数返回的源代码是经过客户端改动之后的网页的源码(如通过AutoIt或者客户端JavaScript). 因此可能和在浏览器中显示的或通过_INetGetSource得到的源码不一样.

afan 发表于 2011-4-13 22:37:16

回复 19# bakefish


    过奖了~ 你研究得很透彻啊~ 呵呵
我知道LZ的乱码只是小问题,关键是获取不到完整的网页源码~
我曾经也对Js郁闷过,经过一番测试最后使用_IEDocReadHTML()成功~ 之后基本上如果采用其它方法不能完整获取的我都会用此方法。

love5173 发表于 2011-4-13 23:45:34

回复 21# afan
乱码是小问题,什么问题呢

afan 发表于 2011-4-13 23:53:14

回复 22# love5173


    我想一般是网页中指定的编码格式与文件格式不符造成的。你1#的方式修改下即可#include <INet.au3>
$s_URL='http://www.wowxunyou.com/'
$soure = _INetGetSource($s_URL, 0)
Msgbox(0, 0, BinaryToString($soure, 4))

nerdpal 发表于 2011-4-19 15:11:29

请问,能否读取IE源码,并识别其中的表单,输出到Excel中使用?

kood481748 发表于 2011-4-19 20:31:50

请问,怎么从IE源码中,提取表单部份的html代码保存出来?
提取<form …………………… </form>这部份代码出来

xlcwxl 发表于 2011-4-20 22:04:33

我觉得都是写入文本里面然后提取比较方便

dancingspider 发表于 2013-5-27 23:57:39

这个好支持你一下
页: 1 [2]
查看完整版本: 读取IE源码的问题