找回密码
 加入
搜索
查看: 2296|回复: 2

[系统综合] 如何获取网页真实地址

[复制链接]
发表于 2015-9-17 21:52:33 | 显示全部楼层 |阅读模式
本帖最后由 bhffhzh 于 2015-9-17 21:55 编辑

http://weixin.sogou.com/gzh?openid=oIWsFt0IYOT4jpqJMuJOIbIRTYg4
打开后是一些蓝色的标题及文章,如何获取各蓝色文字标题及它他真实地址?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
发表于 2015-9-18 08:55:56 | 显示全部楼层


;ACN提问解答
#include<IE.au3>
#include<array.au3>
;打开指定网址
$oIE = _IECreate("http://weixin.sogou.com/gzh?openid=oIWsFt0IYOT4jpqJMuJOIbIRTYg4")
Dim $InnerText;临时保存标题文字

Do;这个循环只用来判断网页中已经加载了含有需要获取的字段,如果没有此循环,网页未完全加载自然没有需要的标题和网址。
        ;获取所有A开头的标记段
        $TagA = _IETagNameGetCollection($oIE, "a")

        For $A In $TagA
                
                ;获取指定条件的A
                If $A.classname = 'news_lst_tab zhz' And $A.classname <> '0' Then

                        $InnerText = $A.innertext
                        
                EndIf
        Next
        ;如果标题长度大于6,表示有效
Until StringLen($InnerText) > 6

Dim $TitleUrlArr[1][2]
$i = 0
For $A In $TagA
        If $A.classname = 'news_lst_tab zhz' And $A.classname <> '0' Then
                
                ;重定义数组
                $i += 1
                ReDim $TitleUrlArr[$i][2]
                
                $TitleUrlArr[$i - 1][0] = $A.innertext ;保存标题
                $TitleUrlArr[$i - 1][1] = $A.href;保存网址
                
        EndIf
Next

_ArrayDisplay($TitleUrlArr,'标题网址')

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
 楼主| 发表于 2015-9-18 09:27:10 | 显示全部楼层
这方面,还真实空白,一直没研究过,感谢这个例子。
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-12-23 01:54 , Processed in 0.086568 second(s), 24 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表