找回密码
 加入
搜索
查看: 4510|回复: 5

[IE类操作] 已解决。对网页数据抓取真是一窍不通,请教如下网页怎么捕获数据?谢谢

  [复制链接]
发表于 2014-3-17 00:41:46 | 显示全部楼层 |阅读模式
本帖最后由 bhwhui 于 2014-3-18 13:09 编辑

如题:没学过网页设计,ASP,Js,框架一窍不通。AU3倒是会点,看到网页抓取就头大。
请教如下网页用什么命令读取好些?按钮用什么函数?给个思路,简单列举函数名即可。当然有现成的程序参考,更好,谢谢。
 楼主| 发表于 2014-3-17 00:43:01 | 显示全部楼层
为了各位老师不打那么多字,网址如下:
http://www.shfe.com.cn/statement ... ?paramid=dailystock
发表于 2014-3-17 13:51:33 | 显示全部楼层
用网页快捕http://www.autoitx.com/forum.php?mod=viewthread&tid=29196
可以发现这是一个框架 真正的地址是http://www.shfe.com.cn/data/dailydata/20140314dailystock.html 20140314当然就是日期了,你所需要的数据直接用_INetGetSource读取html源文件 再提取就是了。
 楼主| 发表于 2014-3-17 17:12:15 | 显示全部楼层
谢谢,明白怎么处理了,现在获得是乱码,加上一大堆源代码,不会是这样的吧?
发表于 2014-3-17 17:54:56 | 显示全部楼层
回复 4# bhwhui

乱码是网页编码问题,读取源代码时,以二进制方式读取,然后再转码。
$bValue = _INetGetSource($url, False)
$sTxt = BinaryToString($bValue, 4)
 楼主| 发表于 2014-3-18 13:08:09 | 显示全部楼层
本帖最后由 bhwhui 于 2014-3-18 13:10 编辑

数据读出来了,很多标示符啊,看着更晕。直接复制,黏贴,更快,读到内存比较算了,因为我需要每个品种的合计数,正则搞不定。
谢谢楼上各位的帮助,谢谢。
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-11-17 03:31 , Processed in 0.078338 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表