找回密码
 加入
搜索
查看: 11397|回复: 18

[IE类操作] 源码获取不到的网页如何查找指定字符串?

  [复制链接]
发表于 2014-10-30 16:23:50 | 显示全部楼层 |阅读模式
对于post和get,或者_IEDocReadHTML都只能返回部分网页源码,有些动态数据是不能获取,以下思路是:

在打开的网页页面查找指定字符串,类似于CTRL+F一样查找,如何实现呢?
发表于 2014-10-30 17:25:32 | 显示全部楼层
给出网页吧~说说哪些是获取不到的?
 楼主| 发表于 2014-10-30 18:30:51 | 显示全部楼层
回复 2# haijie1223

外网打不开,Google play 里面的
 楼主| 发表于 2014-10-31 22:09:22 | 显示全部楼层
回复 2# haijie1223


地址如下:

https://play.google.com/apps/pub ... 203094#AppListPlace

不过外网带不开,除非是有google developer环境,希望能打得开的AU3帮忙测试一下
发表于 2014-11-1 08:17:35 | 显示全部楼层
如是浏览器,本地能看到的网页文本内容,就说明本地获取到了,其一般遵循的也是http协议,post和get,或者_IEDocReadHTML应该都 能获取到的。注意一下网页中是否有框架吧。
发表于 2014-11-1 15:12:14 | 显示全部楼层
#Include <WinHTTP.au3>
Global $sHtml
$hOpen = _WinHttpOpen()
$hConnect = _WinHttpConnect($hOpen, "accounts.google.com")
$hRequest = _WinHttpOpenRequest($hConnect, "GET", "/ServiceLogin?service=androiddeveloper&passive=1209600&continue=https://play.google.com/apps/publish/?dev_acc%3D12435886029200203094&followup=https://play.google.com/apps/publish/?dev_acc%3D12435886029200203094")
_WinHttpSendRequest($hRequest)
_WinHttpReceiveResponse($hRequest)
If _WinHttpQueryDataAvailable($hRequest) Then
        While 1
                $sHtml &=_WinHttpReadData($hRequest,1)&@CRLF
                If @error Then ExitLoop
        Wend
EndIf
_WinHttpCloseHandle($hRequest)
_WinHttpCloseHandle($hConnect)
_WinHttpCloseHandle($hOpen)
ConsoleWrite($sHtml & @CRLF)
发表于 2014-11-1 15:24:24 | 显示全部楼层
源码太长,文字发布上来,附件懒得搞~自己试试吧
 楼主| 发表于 2014-11-1 19:42:39 | 显示全部楼层
回复 5# shqf

用post和get抓包的时候,网页直接不会完全显示,而是提示要重新刷新,所以网页应该用了保护之类的
 楼主| 发表于 2014-11-1 19:46:53 | 显示全部楼层
回复 6# haijie1223

看得出来你好像在某产品下工作?这个GET是不是要用IE登录账号进去才可以用?

这个地址本来是要登录才可以用的,现在没有测试环境,周一试试看看能不能获取得到全部源码
发表于 2014-11-2 08:22:09 | 显示全部楼层
回复 9# chamlien


    什么叫某产品下工作?就是用你给的地址操作的~没有帐号~直接就是获取没有登陆界面的源码啊
 楼主| 发表于 2014-11-2 11:13:30 | 显示全部楼层
回复 10# haijie1223

这样的?我本地都打不开的
发表于 2014-11-2 14:24:37 | 显示全部楼层
回复 11# chamlien


    谷歌当然是要vpn了~
 楼主| 发表于 2014-11-3 11:34:35 | 显示全部楼层
回复 12# haijie1223

测试了,返回的是登录界面的源码,不是我想要的界面源码
 楼主| 发表于 2014-11-3 18:51:53 | 显示全部楼层
回复 2# haijie1223

我把网页保存了下来,我想操作的是匹配每组Reply to this review上一行的文字,然后点击Reply to this review,但是网页获取的源码是获取不到Reply to this review所有组数的文字,网页源码和本地网页见附件,麻烦有时间帮忙解答一下。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
发表于 2014-11-3 21:56:20 | 显示全部楼层
回复 14# chamlien


    没有用户名和密码,怎么进入,可不就是登陆界面的源码?
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-11-17 12:30 , Processed in 0.086465 second(s), 24 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表