[已解决] 求助,取网页源码,正则替换问题。谢谢
本帖最后由 pingfan5888 于 2012-7-11 13:01 编辑我现在取得的结果为
118.96.203.160</td><td>3128</td><td>透明</td><td>whois</td><td><div class="addr_style">印度尼西亚CZ88.NET
190.228.83.181</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">阿根廷CZ88.NET
118.97.170.195</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">印度尼西亚CZ88.NET
173.160.74.252</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">美国CZ88.NET
200.110.180.4</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">阿根廷CZ88.NET
186.208.204.214</td><td>8080</td><td>透明</td><td>whois</td><td><div class="addr_style">巴西CZ88.NET
.......................
如何更改,才能使结果为:
91.121.167.167$$3128$$透明$$法国
113.106.194.219$$82$$高度匿名$$广东省惠州市 电信
122.72.28.19$$80$$透明$$甘肃省 铁通
122.97.16.76$$3128$$透明$$江苏省 联通
这种形式的,
中间替换多添加几个,就没有内容了,请教大大们。谢谢。#include <array.au3>
#include <INet.au3>
$Source = _INetGetSource('http://www.cz88.net/proxy/')
Local $str = ''
$sR = StringRegExp($Source, '<tr><td>(.*</td><td>.*</td><td>.*</td><td>.*</td><td><div class="addr_style">.*)</div></td></tr>', 3)
For $i = 0 To UBound($sR) - 1 Step 2
$str&=StringRegExpReplace($sR[$i],$sR[$i],'$1')&@CRLF&$sR[$i+1]&@CRLF
Next
FileWriteLine('222.txt', $str & @CRLF)
Exit #include <INet.au3>
Local $str = _INetGetSource('http://www.cz88.net/proxy/')
Local $sRep = StringRegExpReplace($str, '^(?si).*?地址</td>\s+</tr>\v+|<script.*?</script>|\s+</table>.*|\h+<tr><td.*?>(?:<!.*?>)?|\s*</td></tr>', '')
$sRep = StringReplace($sRep, '</td><td>', '$$')
$sRep = StringRegExpReplace($sRep, '(?i)whois\$\$<.+?>|</div>|\v{4}', '')
MsgBox(0, '整理结果', $sRep) 回复 2# afan
谢谢大大。 A版 正则神人{:face (332):} 我这里Local $str = _INetGetSource('http://www.cz88.net/proxy/')取不到源码! 感谢,感谢,学习,学习,非常感谢
页:
[1]