找回密码
 加入
搜索
查看: 6885|回复: 5

[系统综合] [已解决] 求助,取网页源码,正则替换问题。谢谢

  [复制链接]
发表于 2012-7-11 03:49:17 | 显示全部楼层 |阅读模式
本帖最后由 pingfan5888 于 2012-7-11 13:01 编辑

我现在取得的结果为
118.96.203.160</td><td>3128</td><td>透明</td><td>whois</td><td><div class="addr_style">印度尼西亚  CZ88.NET

190.228.83.181</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">阿根廷  CZ88.NET

118.97.170.195</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">印度尼西亚  CZ88.NET

173.160.74.252</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">美国  CZ88.NET

200.110.180.4</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">阿根廷  CZ88.NET

186.208.204.214</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">巴西  CZ88.NET
.......................

如何更改,才能使结果为:

91.121.167.167$$3128$$透明$$法国
113.106.194.219$$82$$高度匿名$$广东省惠州市 电信
122.72.28.19$$80$$透明$$甘肃省 铁通
122.97.16.76$$3128$$透明$$江苏省 联通

这种形式的,

中间替换多添加几个,就没有内容了,请教大大们。谢谢。
#include <array.au3>
#include <INet.au3>
$Source = _INetGetSource('http://www.cz88.net/proxy/')
Local $str = ''
$sR = StringRegExp($Source, '<tr><td>(.*</td><td>.*</td><td>.*</td><td>.*</td><td><div class="addr_style">.*)</div></td></tr>', 3)

For $i = 0 To UBound($sR) - 1 Step 2
        

 $str&=StringRegExpReplace($sR[$i],$sR[$i],'$1')&@CRLF&$sR[$i+1]&@CRLF

Next

FileWriteLine('222.txt', $str & @CRLF)
Exit
发表于 2012-7-11 09:01:52 | 显示全部楼层
#include <INet.au3>
Local $str = _INetGetSource('http://www.cz88.net/proxy/')
Local $sRep = StringRegExpReplace($str, '^(?si).*?地址</td>\s+</tr>\v+|<script.*?</script>|\s+</table>.*|\h+<tr><td.*?>(?:<!.*?>)?|\s*</td></tr>', '')
$sRep = StringReplace($sRep, '</td><td>', '$$')
$sRep = StringRegExpReplace($sRep, '(?i)whois\$\$<.+?>|</div>|\v{4}', '')
MsgBox(0, '整理结果', $sRep)
 楼主| 发表于 2012-7-11 13:00:51 | 显示全部楼层
回复 2# afan


    谢谢大大。
发表于 2012-7-11 15:48:48 | 显示全部楼层
A版 正则神人
发表于 2012-7-20 17:36:29 | 显示全部楼层
我这里Local $str = _INetGetSource('http://www.cz88.net/proxy/')取不到源码!
发表于 2014-9-4 09:20:22 | 显示全部楼层
感谢,感谢,学习,学习,非常感谢
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-11-23 22:30 , Processed in 0.087110 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表