boyhong 发表于 2010-8-4 11:34:47

[已解决]网页源码的正则提取请指点

本帖最后由 boyhong 于 2010-8-4 11:56 编辑

看到零宽断言那儿被彻底打倒了。。唉,现在信心方面都受到了打击。。。
   请教您以下问题,然后根据您的答案,希望自己能重新往下学习.....
    无限感谢~~~
源网址:http://www.symantec.com/business/security_response/definitions/download/detail.jsp?gid=savce#include <Inet.au3>
      $Source = _INetGetSource('http://www.symantec.com/business/security_response/definitions/download/detail.jsp?gid=savce')
                $sRep = StringRegExpReplace($Source, '.+href(.+?)>.+', '$1')
                Exit(MsgBox(0, '结果:', $sRep))我想提取以上源网址的链接:http://definitions.symantec.com/defs/(这一部分是每天都在变动的内容)-v5i32.exe用以它用!

规律是:http://definitions.symantec.com/defs/是死的.v5i32.exe 这个也是死的

afan 发表于 2010-8-4 11:51:51

这里不需要零宽断言~#include <Inet.au3>
$Source = _INetGetSource('http://www.symantec.com/business/security_response/definitions/download/detail.jsp?gid=savce')
$sR = StringRegExp($Source, '(http:.+?v5i32\.exe)\"', 3)
If Not @Error Then MsgBox(0, '结果:', $sR)

boyhong 发表于 2010-8-4 11:55:30

无限之感谢~afan
正则啊。。天,看着看着很晕地说~~~

afan 发表于 2010-8-4 11:58:13

回复 3# boyhong


    呵呵 这个相对来说是很简单的,可能是你一开始就往复杂里想去了~

水木子 发表于 2010-8-4 12:02:41

本帖最后由 水木子 于 2010-8-4 12:04 编辑

前辈的正则运用得淋漓尽致,这是大家都看在眼里、记在心里,不可否认的。
前辈有空给大家讲解下吧!开堂课之类的,讲讲正则的入门也好啊!

51ak 发表于 2010-8-4 15:33:04

我想就是把变化的部分作为变量吧
页: [1]
查看完整版本: [已解决]网页源码的正则提取请指点