找回密码
 加入
搜索
楼主: sex123

[系统综合] 帮我写一个正规表达式,谢.

 火.. [复制链接]
发表于 2012-9-22 20:08:55 | 显示全部楼层
$TEXT_BACK="";网页代码
$WebTextA=StringRegExp($TEXT_BACK,'pdfurl=".*?"',3);正则取网址
$55=$WebTextA[0]
$44=StringReplace ( $55, "amp;", "" );替换字符串中的指定子串.得到网页的下载地址
ClipPut($44);写入剪贴板 得到网页的下载地址
发表于 2012-9-22 20:21:40 | 显示全部楼层
自动取下载网址:

$TEXT_BACK = BinaryToString(InetRead('http://www.sciencedirect.com/science/article/pii/B9780122841514500002/',1+8),4);主页代码
$WebTextA=StringRegExp($TEXT_BACK,'pdfurl="(.*?)"',3);正则取网址
$55=$WebTextA[0]
$44=StringReplace ( $55, "amp;", "" );替换字符串中的指定子串.得到网页的下载地址
ClipPut($44);写入剪贴板 得到网页的下载地址
 楼主| 发表于 2012-9-22 22:30:47 | 显示全部楼层
我想要一个真正能运行成功的代码,我都试了,还是不行.
 楼主| 发表于 2012-9-22 23:49:24 | 显示全部楼层
本帖最后由 sex123 于 2012-9-22 23:51 编辑
自动取下载网址:

$TEXT_BACK = BinaryToString(InetRead('http://www.sciencedirect.com/science/artic ...
jtzxgfy 发表于 2012-9-22 20:21



    这个测试成功了,但是我的要求是打开网页后,点击PDF,下载PDF.因为需要挂代理或EZ才能得到权限的提升.
http://www.sciencedirect.com/sci ... i/S0304383511007361
比如这个,换个地址,你的方法就不行了,还是在ie里面好点.
 楼主| 发表于 2012-9-23 00:10:25 | 显示全部楼层
我又测试了一下,还行,我在前面加了一行代理,就好用了.谢谢了.
HttpSetProxy(2, "130.132.123.28:3128","username","password")
$TEXT_BACK = BinaryToString(InetRead('http://www.sciencedirect.com/science/article/pii/S0304383511007361/',1+8),4);主页代码
$WebTextA=StringRegExp($TEXT_BACK,'pdfurl="(.*?)"',3);正则取网址
$55=$WebTextA[0]
$44=StringReplace ( $55, "amp;", "" );替换字符串中的指定子串.得到网页的下载地址
ClipPut($44);写入剪贴板 得到网页的下载地址
发表于 2012-9-23 00:36:30 | 显示全部楼层
最新研究

$TEXT_BACK = BinaryToString(InetRead('http://www.sciencedirect.com/science/article/pii/B9780122841514500002/',1+8),4);主页代码
$WebTextA=StringRegExp($TEXT_BACK,'pdfurl="(.*?)"',3);正则取网址

$ww=StringSplit ( $WebTextA[0], "&pid=" , 1 )   ;拆分 以"&pid=" 拆分
$ee= $ww[2];取第二拆分 文件名
InetGet($WebTextA[0], $ee, 1, 0);防盗链的网站要这样 下载才行的 
MsgBox(262144, "下载完成",$WebTextA[0],2)
 楼主| 发表于 2012-9-23 00:55:23 | 显示全部楼层
最新研究

$TEXT_BACK = BinaryToString(InetRead('http://www.sciencedirect.com/science/article/pii/B ...
jtzxgfy 发表于 2012-9-23 00:36



    有的时候加代理后,会出错,可能是因为代理没连上,然后没有权限取得PDF地址的原因.我再研究研究.
发表于 2012-10-7 15:27:11 | 显示全部楼层
其实我没搞懂你到底需要用正则获取哪段内容?
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-12-22 20:17 , Processed in 0.064544 second(s), 13 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表