[已解决]网页源码的正则提取请指点
本帖最后由 boyhong 于 2010-8-4 11:56 编辑看到零宽断言那儿被彻底打倒了。。唉,现在信心方面都受到了打击。。。
请教您以下问题,然后根据您的答案,希望自己能重新往下学习.....
无限感谢~~~
源网址:http://www.symantec.com/business/security_response/definitions/download/detail.jsp?gid=savce#include <Inet.au3>
$Source = _INetGetSource('http://www.symantec.com/business/security_response/definitions/download/detail.jsp?gid=savce')
$sRep = StringRegExpReplace($Source, '.+href(.+?)>.+', '$1')
Exit(MsgBox(0, '结果:', $sRep))我想提取以上源网址的链接:http://definitions.symantec.com/defs/(这一部分是每天都在变动的内容)-v5i32.exe用以它用!
规律是:http://definitions.symantec.com/defs/是死的.v5i32.exe 这个也是死的 这里不需要零宽断言~#include <Inet.au3>
$Source = _INetGetSource('http://www.symantec.com/business/security_response/definitions/download/detail.jsp?gid=savce')
$sR = StringRegExp($Source, '(http:.+?v5i32\.exe)\"', 3)
If Not @Error Then MsgBox(0, '结果:', $sR) 无限之感谢~afan
正则啊。。天,看着看着很晕地说~~~ 回复 3# boyhong
呵呵 这个相对来说是很简单的,可能是你一开始就往复杂里想去了~ 本帖最后由 水木子 于 2010-8-4 12:04 编辑
前辈的正则运用得淋漓尽致,这是大家都看在眼里、记在心里,不可否认的。
前辈有空给大家讲解下吧!开堂课之类的,讲讲正则的入门也好啊! 我想就是把变化的部分作为变量吧
页:
[1]