StringRegExp 函数参考中文版——包括 StringRegExp & Replace 测试工具!
StringRegExp 函数的重要性就不必多说了吧?可惜AutoIt 汉化版中此函数的帮助没有翻译。昨天我花了整整一天时间,终于将它翻译完了。为了能够正确的表述,使用的是意译,而且里面也一定存在表述不清、错误等情况,所以:
希望大家能群策群力,修正、补充、完善本帮助!
同时也希望汉化版也能早日更新帮助文件!
StringRegExp
=============
StringRegExp ( "test", "pattern" [, flag ] [, offset ] ])
检验一个字符串是否适合某一特定的正则表达式模式。
test 被检验字符串
pattern 正则表达式模式
flag [可选],决定返回方式,默认为0
offset [可选],开始检验的位置,默认为1,即从头开始
flag 值
0 返回 1 (匹配)或 0 (无匹配)
1 返回数组型匹配
2 同 1,包含所有匹配(Perl / PHP方式)
3 同 1,返回值为匹配的全部
4 同 2 + 3
@Error
=======
Flag = 0:
2 正则表达式错误。@Extended=表达式中出错的位置
Flag= 1 或 2:
0 数组有效。@Extended=下一个位置
1 无匹配,数组无效。
2 表达式错误,数组无效。@Extended=表达式中出错的位置
Flag = 3 或 4:
0 数组有效
1 无匹配,数组无效
2 表达式错误,数组无效。@Extended=表达式中出错的位置
注意
=====
正则表达式是一种精炼的字符串表达方式,表达式使用特殊意义的字符组合,匹配目标字符串中的特定字符组合。Autoit 的正则表达式通常是大小写敏感的。
正则表达式由下面所列的一个或多个简单的规则组成,如果某字符没有存在于下列表格中,那么该字符将只能匹配其自身。
次数修饰符(*, +, ?, {...}) 将尝试最大可能的匹配,使第一次匹配之后的字符也能得到匹配,除非前面是 ?,?... 使用最小匹配模式。
表达式允许嵌套,但请注意,除了没有匹配值的表达式,在返回的数组中,里面的表达式匹配的值在前,而外面的表达式匹配的值在后。
完整的说明可以在这里找到:http://www.autoitscript.com/autoit3/pcrepattern.html
注意:错误的正则表达式可能导致死循环,甚至崩溃。
匹配字符
=========
[...] 匹配[]内的任何字符。如 匹配任何小写元音字母。可以使用破折号定义起始和结束字符匹配字符集,如 匹配任何小写字母;又如 [][] 可以匹配 。要注意的是,[]内的特殊字符需要使用转义符 \ 来匹配自身,比如:\\,\^,\-,\[,\]
[^...] 匹配 "..." 外的任何字符。如: [^0-9] 匹配任何非数字。同上,如果是需要匹配字符 "^",则需要使用转义符,如 \^
[:class:] :class: 代表字母类匹配符,其匹配内容请参考下文
[^:class:] 匹配 :class: 之外的字符,but only if the first character.
(...) 组内的元素在匹配时将被一起考虑,如 (ab)+ 将匹配 "ab" 或 "abab" 等,但不会是 "aba"。根据 Flag 的定义,组可以用数组存储匹配的文本,以便之后调用。
(?i) 大小写不敏感标志,这不是组,而是告诉引擎从此处开始的匹配不区分大小写
(?-i) (默认)大小写敏感标志,同样不是组,而是告诉引擎从此处开始的匹配区分大小写
(?i...) 大小写不敏感组,组内元素不区分大小写,其它同普通组
(?-i...) 大小写敏感组,组内元素区分大小写,其它同普通组。主要用在 (i) 后面或者 (?i...) 内
(?:...) 不用捕获的组。类似普通组,只是输出匹配数组也不返回用于 back-referencing 的匹配文字
(?i:…) 同上,但不区分大小写
(?-i:...) 同上,但区分大小写
(?m) 同^ 和 $ ,仅匹配行内数据
(?s) 同 . ,匹配行内的任何数据("." 默认不匹配换行符)
(?x) 忽略空格和 # 注释
(?U) 非贪婪模式
. 除换行符外的任何字符
| 或,用前或后侧表达式匹配
\ 转意符,让元字符匹配自身,或使字符代表特殊功能(见下文)
\\ 实际反斜线( \)
\a 警告,即字符 BEL (chr(7))
\A 只匹配字符串开始处
\b 匹配词的边界(头或尾)
\B 匹配词边界以外的区域
\c 根据下一字符匹配 ASCII 控制符,如 \cM 匹配 Ctrl-M
\d 匹配数字(0-9)
\D 匹配非数字
\e 匹配 Escape (chr(27))
\E 区域终点,需组合使用
\f 匹配换页符 (chr(12))
\h 横向空白字符如 Tab
\H 非横向空白字符
\l 下一字符为小写
\L 匹配时 \L...\E 区域内字符转小写
\n 匹配换行符(@LF,chr(10))
\Q \Q(...)...\E,忽略()内元字符的功能
\r 匹配回车(@CR,chr(13))
\s 匹配任何空白字符:chr(9)-chr(13),即横向Tab,换行符,垂直Tab,换页符,回车,空格(chr(32))
\S 匹配任何非空白字符
\t 匹配制表符(chr(9))
\u 下一字符为大写
\U 匹配时 \U...\E 区域内字符转大写
\v 垂直空白字符
\V 非垂直空白字符
\w 匹配a-z,A-Z,0-9,以及_(下划线)
\W 匹配 \w 以外的字符
\### 匹配由 3 个8进制组成的 ASCII 字符,可匹配 ASCII 字符及 back-reference,如 ([:alpha:])\1 匹配 - (连字符)
\x## 匹配由 2 个16进制数组成的 ASCII 字符
\z 匹配字串尾部
\Z 同上,但可用于多行时匹配行尾
次数修饰符
===========
{x} 重复匹配 x 次
{x,} 重复匹配次数 >= x
{0,x} 重复匹配 0 到 x 次
{x,y} 重复匹配 x 到 y 次
* ={0,},即重复匹配次数 >= 0
+ ={1,},即重复匹配次数 >= 1
? ={0,1},即重复匹配 0 到 1 次
?... 匹配 "..." 的最小匹配可能
字母类匹配符
=============
[:alnum:] 字母和数字
[:alpha:] 字母
[:ascii:] 0 - 127 内的 ASCII 字符
[:blank:] 空格和制表符
[:cntrl:] 控制字符
[:digit:] 数字(同 \d)
[:graph:] 可打印字符,不包括空格
[:lower:] 小写字母
[:print:] 可打印字符,包括空格
[:punct:] 字母和数字以外的打印字符
[:space:] 空白字符(不同于 \s,它包括 VT(chr(11)))
[:upper:] 大写字母
[:word:] 字(同 \w)
[:xdigit:] 16进制数
[ 本帖最后由 pw4321 于 2008-6-30 22:04 编辑 ] 沙发啊!
谢谢楼主,学习了! 修正几处错误:
1.(?:...) 非获取匹配组,匹配 ... 但只用于确定位置而不返回匹配结果,同样也不会返回 \i
2. \### 匹配8进制值为 ### 的 ASCII字符,可匹配 ASCII字符及 \i ,如 ([:alpha:])\1 匹配 - (连字符)
3.\x## 16进制值为 ## 的ASCII字符,如:\x311 匹配 11
补充说明:
\i 或 $i 前面第i个子表达式 () 匹配的捕获,i=1,2,3...
如:<t(.*?)>caption<\/\1> 可匹配 <title>caption</title>
但更多是用于 Replace
牛。。。。。。。。。。。:face (33): 修正:
\Q \Q(...)...\E,忽略()内元字符的功能
=>
\Q \Q...\E,忽略 ... 内所有元字符的功能
\Q(.)\E 将匹配连在一起的:(.)
[ 本帖最后由 pw4321 于 2008-6-30 21:37 编辑 ] AutoIt3正则表达式检测工具:
#NoTrayIcon
Opt("MustDeclareVars", 1)
Local $Test, $Pattern, $Replace, $Flag = 0, $Offset = 1, $Count = 0
Local $Ip1, $Ip2, $Ip3, $Ip4, $Lb1, $Lb2, $Bt1, $Bt2, $Mode="匹配模式"
GUICreate("AutoIt3 正则表达式",300,160)
GUICtrlCreateLabel("测试字符串:",10,13,70,20)
$Ip1=GUICtrlCreateInput($Test,80,10,210,20)
GUICtrlCreateLabel("匹配表达式:",10,43,70,20)
$Ip2=GUICtrlCreateInput($Pattern,80,40,210,20)
$Lb1=GUICtrlCreateLabel("输出标志:",10,73,70,20)
$Ip3=GUICtrlCreateInput($Flag,80,70,210,20)
$Lb2=GUICtrlCreateLabel("起始位偏移:",10,103,70,20)
$Ip4=GUICtrlCreateInput($Offset,80,100,210,20)
$Bt1=GUICtrlCreateButton($Mode,50,130,80,25)
$Bt2=GUICtrlCreateButton("输出结果",170,130,80,25)
GUISetState()
While 1
Switch GUIGetMsg()
Case -3
Exit
Case $Bt1
Switch $Mode
Case "匹配模式"
$Mode = "替换模式"
GUICtrlSetData($Lb1, "替换表达式:")
GUICtrlSetData($Ip3, $Replace)
GUICtrlSetData($Lb2, "替换次数:")
GUICtrlSetData($Ip4, $Count)
Case "替换模式"
$Mode = "匹配模式"
GUICtrlSetData($Lb1, "输出标志:")
GUICtrlSetData($Ip3, $Flag)
GUICtrlSetData($Lb2, "起始位偏移:")
GUICtrlSetData($Ip4, $Offset)
EndSwitch
GUICtrlSetData($Bt1,$Mode)
Case $Bt2
Local $Return = ""
$Test = GUICtrlRead($Ip1)
$Pattern = GUICtrlRead($Ip2)
If NOT ($Test AND $Pattern) Then ContinueLoop
Switch $Mode
Case "匹配模式"
; GUICtrlRead() 获取的是字符,使用 IsInt() 判断时总是得到结果 0
$Flag = GUICtrlRead($Ip3)
If NOT StringRegExp($Flag, "^$") Then
MsgBox(16, "错误", "输出标志只能是 0-4 之间的整数!")
ContinueLoop
EndIf
$Offset = Number(GUICtrlRead($Ip4))
If StringRegExp($Offset, "^\d*$") Then
MsgBox(16, "错误", "起始位偏移只能是 1 以上的整数!")
ContinueLoop
EndIf
Dim $_Return = StringRegExp($Test,$Pattern,$Flag,$Offset)
If IsArray($_Return) Then
For $i In $_Return
$Return &= $i & @LF
Next
Else
$Return = $_Return
EndIf
Switch $Flag
Case 0
Switch @error
Case 0
If $Return Then
MsgBox(0, "结果", "存在可匹配字符!")
Else
MsgBox(0, "结果", "无匹配!")
EndIf
Case 2
MsgBox(16, "错误", "匹配表达式第 " & @extended & " 位无效")
Case Else
MsgBox(16, "错误", "@error=" & @error &@LF& "@Extended=" & @extended)
EndSwitch
Case 1 To 4
Switch @error
Case 0
MsgBox(0, "结果", "匹配结果为:" &@LF& $Return &@LF& "@Extended=" & @extended)
Case 1
MsgBox(16, "错误", "无匹配!")
Case 2
MsgBox(16, "错误", "匹配表达式第 " & @extended & " 位无效")
Case Else
MsgBox(16, "错误", "@error=" & @error &@LF& "@Extended=" & @extended)
EndSwitch
EndSwitch
Case "替换模式"
$Replace = GUICtrlRead($Ip3)
$Count = Number(GUICtrlRead($Ip4))
If NOT StringRegExp($Count, "^\d*$") Then
MsgBox(16, "错误", "替换次数只能是 1 以上的整数!")
ContinueLoop
EndIf
Dim $Return = StringRegExpReplace($Test,$Pattern,$Replace,$Count)
Switch @error
Case 2
MsgBox(16, "错误", "匹配表达式第 " & @extended & " 位无效")
Case 0
MsgBox(0, "结果", "替换结果为:" & $Return &@LF& "共替换了 " & @extended & " 次")
Case Else
MsgBox(16, "错误", "@error=" & @error &@LF& "@Extended=" & @extended)
EndSwitch
EndSwitch
EndSwitch
WEnd
修正了一些错误,可惜不能上传附件,我重写了一个较完整的,支持输出完整表达式的程序,代码长了点。不过这个也凑活。
[ 本帖最后由 pw4321 于 2008-7-3 00:00 编辑 ]
Preview
无法上传附件:AUTOIT CN 提示信息
附件文件无法保存到服务器,可能是目录属性设置问题,请与管理员联系。
所以也无法上传预览图了,请自己试试吧 :face (31): 非常值得称赞!这个函数非常实用,而且正则表达式是一门高深的学问啊! :face (34): 贡献!!
不顶不行!·!! 这个贴 强总算 有人把 这个东西给汉化了
谢。 收藏先 希望下个AU3i汉化版的帮助文件能收录进去! 楼主有能力 把http://www.autoitscript.com/autoit3/pcrepattern.html 也汉化一下吧~~~~~~~~~ 贡献啊..收藏了.谢谢.
我也来顶顶这个资料
赞赞赞赞,顶爽顶爽