找回密码
 加入
搜索
查看: 15124|回复: 32

[效率算法] 请教如何用正则提取用户名、密码、有效期[已解决]

 火... [复制链接]
发表于 2012-6-4 08:37:42 | 显示全部楼层 |阅读模式
本帖最后由 lsszmj 于 2012-6-7 01:56 编辑

请教如何用正则提取用户名、密码、有效期
 id:'fks_087066087083082065084080087064072084081071093084084070084084',
              blogTitle:'id',
              blogAbstract:'<P\>Username:EAV-63977143<BR\>Password:8j4aa2r3pk<BR\>Expiration:2012/10/10</P\>  <P\>Username:EAV-59363841<BR\>Password:jp2ne237bc<BR\>Expiration:2012/06/15</P\>  <P\>Username:EAV-49173126<BR\>Password:m46xhrxhfs<BR\>Expiration:2012/10/09</P\>  <P\>Username:EAV-59363841<BR\>Password:jp2ne237bc<BR\>Expiration:2012/06/15<BR\></P\>',
              blogTag:'esetnod32,id',
              blogUrl:'blog/static/204922502201253115027705',
附上网址:http://lss53.blog.163.com/blog/static/204922502201253115027705/
不知何故,正则学习就是不得法门,老是做伸手党,谢谢各位帮个忙哈。
发表于 2012-6-4 09:11:41 | 显示全部楼层
本帖最后由 haijie1223 于 2012-6-4 09:30 编辑

用户名:
(?m)(?<=Username:)\w+\-\d+

密码:
(?m)(?<=Password:)\w+

有效期:
(?m)(?<=Expiration:)\d{4}\/\d{2}\/\d{2}



#include <INet.au3>
#include <array.au3>
Local $S, $usename, $password, $Expiration, $a
$S = _INetGetSource("http://lss53.blog.163.com/blog/static/204922502201253115027705/")
$usename = StringRegExp($S, "(?m)(?<=Username:)\w+\-\d+", 3)
$password = StringRegExp($S, "(?m)(?<=Password:)\w+", 3)
$Expiration = StringRegExp($S, "(?m)(?<=Expiration:)\d{4}\/\d{2}\/\d{2}", 3)
If UBound($usename) > 0 Then
        Dim $a[UBound($usename)][3]
        For $i = 0 To UBound($usename) - 1
                $a[$i][0] = $usename[$i]
                $a[$i][1] = $password[$i]
                $a[$i][2] = $Expiration[$i]
        Next
EndIf
_ArrayDisplay($a)

评分

参与人数 1金钱 +30 贡献 +2 收起 理由
lixiaolong + 30 + 2

查看全部评分

 楼主| 发表于 2012-6-4 09:21:06 | 显示全部楼层
回复 2# haijie1223
一起整呢?搞到一个数组中,谢谢!
发表于 2012-6-4 09:28:44 | 显示全部楼层
#include <Inet.au3>
#include <Array.au3>
Local $url="http://lss53.blog.163.com/blog/static/204922502201253115027705/"
Local $html=_INetGetSource($url)
Local $array=StringRegExp($html,"<P>(User[^<]+)<BR>(Pass[^<]+)<BR>(Expiration[^<]+)</P>",3)
_ArrayDisplay($array)
发表于 2012-6-4 09:30:56 | 显示全部楼层
回复 3# lsszmj

#include <INet.au3>
#include <array.au3>
Local $S, $usename, $password, $Expiration, $a
$S = _INetGetSource("http://lss53.blog.163.com/blog/static/204922502201253115027705/")
$usename = StringRegExp($S, "(?m)(?<=Username:)\w+\-\d+", 3)
$password = StringRegExp($S, "(?m)(?<=Password:)\w+", 3)
$Expiration = StringRegExp($S, "(?m)(?<=Expiration:)\d{4}\/\d{2}\/\d{2}", 3)
If UBound($usename) > 0 Then
        Dim $a[UBound($usename)][3]
        For $i = 0 To UBound($usename) - 1
                $a[$i][0] = $usename[$i]
                $a[$i][1] = $password[$i]
                $a[$i][2] = $Expiration[$i]
        Next
EndIf
_ArrayDisplay($a)
发表于 2012-6-4 09:36:46 | 显示全部楼层
#include <Array.au3>
Local $Str = _
                "id:'fks_087066087083082065084080087064072084081071093084084070084084'," & @CRLF & _
                "              blogTitle:'id'," & @CRLF & _
                "              blogAbstract:'<P\>Username:EAV-63977143<BR\>Password:8j4aa2r3pk<BR\>Expiration:2012/10/10</P\>  <P\>Username:EAV-59363841<BR\>Password:jp2ne237bc<BR\>Expiration:2012/06/15</P\>  <P\>Username:EAV-49173126<BR\>Password:m46xhrxhfs<BR\>Expiration:2012/10/09</P\>  <P\>Username:EAV-59363841<BR\>Password:jp2ne237bc<BR\>Expiration:2012/06/15<BR\></P\>'," & @CRLF & _
                "              blogTag:'esetnod32,id'," & @CRLF & _
                "              blogUrl:'blog/static/204922502201253115027705',"

Local $Test = StringRegExp($str, '(?:Username|Password|Expiration):([^<]+)', 3)
If Not @Error Then _ArrayDisplay($Test, UBound($Test))

评分

参与人数 2金钱 +37 贡献 +5 收起 理由
user3000 + 7 + 5
haijie1223 + 30 学习了

查看全部评分

 楼主| 发表于 2012-6-4 09:50:00 | 显示全部楼层
本帖最后由 lsszmj 于 2012-6-4 09:57 编辑

回复 4# shqf
回复 5# haijie1223
回复 6# lixiaolong
4#的只提取了三组并包含了前面的关键字,谢谢;
5#的不是我想要的效果,让我也有不少收获,谢谢;
6#的有重复问题,匹配时重复了1倍,谢谢。
发表于 2012-6-4 09:59:02 | 显示全部楼层
回复 7# lsszmj


    你要这么说那你真的就是标准的伸手党,别人都给你代码了,剩下的只是你自己稍微加工一下。
你要吃饭,别人给你馒头了,难道还要喂你吃?
 楼主| 发表于 2012-6-4 10:02:38 | 显示全部楼层
代码整成这样时,6#会重复,
#Include <Array.au3>
$oMyError = ObjEvent("AutoIt.Error","MyErrFunc")
$oHTTP = ObjCreate("winhttp.winhttprequest.5.1")
$Url="http://lss53.blog.163.com/blog/static/204922502201253115027705/"
$a=$oHTTP.Open("GET",$Url)
$oHTTP.Send()
$HTMLSource = $oHTTP.Responsetext
MsgBox(0,'',$HTMLSource)
 
Func MyErrFunc() 
   $HexNumber=hex($oMyError.number,8) 
   Msgbox(0,"","We intercepted a COM Error !" & @CRLF & _
                "Number is: " & $HexNumber & @CRLF & _
                "Windescription is: " & $oMyError.windescription ) 
 
   $_eventerror = 1
Endfunc
Local $Test = StringRegExp($HTMLSource, '(?:Username|Password|Expiration):([^<]+)', 3)
If Not @Error Then _ArrayDisplay($Test, UBound($Test))
 楼主| 发表于 2012-6-4 10:03:52 | 显示全部楼层
回复 8# haijie1223
让兄弟见笑了哈,我在这一块还真是个白痴哦
发表于 2012-6-4 10:14:11 | 显示全部楼层
正在学习正则,学习楼上几位大大的代码
发表于 2012-6-4 10:18:11 | 显示全部楼层
回复 10# lsszmj


    别叫我兄弟,老哥你今年贵庚啊?
发表于 2012-6-4 10:27:56 | 显示全部楼层
回复 9# lsszmj
不是代码重复,是网页源码中在还有四组相同的用户名、口令等内容啊。你要提取网页中显示 的4组,稍改一下就行了啊。我的代码正则改成如下,只取显示的四级:Local $array=StringRegExp($html,"<P>Username:([\w-]+)<BR>Password:(\w+)<BR>Expiration:([\d/]+)<",3)

评分

参与人数 1金钱 +30 贡献 +2 收起 理由
lixiaolong + 30 + 2

查看全部评分

 楼主| 发表于 2012-6-4 13:16:14 | 显示全部楼层
再次感谢各位,我没看仔细哈
发表于 2012-6-4 13:42:21 | 显示全部楼层
本帖最后由 lixiaolong 于 2012-6-4 13:52 编辑

回复 9# lsszmj

试试这个.
#Include <Array.au3>
$oMyError = ObjEvent("AutoIt.Error","MyErrFunc")
$oHTTP = ObjCreate("winhttp.winhttprequest.5.1")
$Url="http://lss53.blog.163.com/blog/static/204922502201253115027705/"
$a=$oHTTP.Open("GET",$Url)
$oHTTP.Send()
$HTMLSource = $oHTTP.Responsetext
MsgBox(0,'',$HTMLSource)

Func MyErrFunc() 
   $HexNumber=hex($oMyError.number,8) 
   Msgbox(0,"","We intercepted a COM Error !" & @CRLF & _
                "Number is: " & $HexNumber & @CRLF & _
                "Windescription is: " & $oMyError.windescription ) 

   $_eventerror = 1
Endfunc
Local $Test = StringRegExp($HTMLSource, '(?s)(?:Username|Password|Expiration):([^<]+)<(?!.*?\1)', 3)
If Not @Error Then _ArrayDisplay($Test, UBound($Test))
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-11-23 19:09 , Processed in 0.101182 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表