如何获取网页真实地址
本帖最后由 bhffhzh 于 2015-9-17 21:55 编辑http://weixin.sogou.com/gzh?openid=oIWsFt0IYOT4jpqJMuJOIbIRTYg4
打开后是一些蓝色的标题及文章,如何获取各蓝色文字标题及它他真实地址?
;ACN提问解答
#include<IE.au3>
#include<array.au3>
;打开指定网址
$oIE = _IECreate("http://weixin.sogou.com/gzh?openid=oIWsFt0IYOT4jpqJMuJOIbIRTYg4")
Dim $InnerText;临时保存标题文字
Do;这个循环只用来判断网页中已经加载了含有需要获取的字段,如果没有此循环,网页未完全加载自然没有需要的标题和网址。
;获取所有A开头的标记段
$TagA = _IETagNameGetCollection($oIE, "a")
For $A In $TagA
;获取指定条件的A
If $A.classname = 'news_lst_tab zhz' And $A.classname <> '0' Then
$InnerText = $A.innertext
EndIf
Next
;如果标题长度大于6,表示有效
Until StringLen($InnerText) > 6
Dim $TitleUrlArr
$i = 0
For $A In $TagA
If $A.classname = 'news_lst_tab zhz' And $A.classname <> '0' Then
;重定义数组
$i += 1
ReDim $TitleUrlArr[$i]
$TitleUrlArr[$i - 1] = $A.innertext ;保存标题
$TitleUrlArr[$i - 1] = $A.href;保存网址
EndIf
Next
_ArrayDisplay($TitleUrlArr,'标题网址')
这方面,还真实空白,一直没研究过,感谢这个例子。
页:
[1]