找回密码
 加入
搜索
查看: 2377|回复: 2

[效率算法] 【已解决】如何用正则匹配多个条件

[复制链接]
发表于 2012-1-29 15:56:05 | 显示全部楼层 |阅读模式
本帖最后由 zch11230 于 2012-1-29 18:37 编辑

比如我需要提取到论坛里面贴子的标题和链接  单独提取标题或链接ID没问题,看帮助说用|符号可以匹配多个条件,但是怎么写也没成功  发贴求教。

ID是纯数字,但长度不一定,标题内容不一定 而且有的标题可能有颜色 多了一句font color=
最终想得到这样的结果
[0][0]111111,[1][0]xxxxxx
[0][1]222222,[1][1]yyyyyy
[0][2]333333,[1][2]zzzzzz
或者这样  意思就是说标题和链接的ID要对应  $i和$i+1对应为一篇帖子。
[0]111111
[1]xxxxxx
[2]222222
[3]yyyyyy
[4]333333
[5]zzzzzz
<a name=111111></a><a href="read-htm-tid-111111-fpage-1.html" id="a_ajax_111111" class="subject"><font color=#FF0000>xxxxxx</font></a>   <span class='gray tpage'>
<a name=222222></a><a href="read-htm-tid-222222-fpage-1.html" id="a_ajax_222222" class="subject">yyyyyy</a>   <span class='gray tpage'>
<a name=333333></a><a href="read-htm-tid-333333-fpage-1.html" id="a_ajax_333333" class="subject">zzzzzz</a>   <span class='gray tpage'>
发表于 2012-1-29 16:35:50 | 显示全部楼层
按这样的条件,这个还算好提取吧.
(只是个人见解, 希望起抛砖引玉之效!)
#include<array.au3>
Local $str = '<a name=111111></a><a href="read-htm-tid-111111-fpage-1.html" id="a_ajax_111111" class="subject"><font color=#FF0000>xxxxxx</font></a> ' & "  <span class='gray tpage'>" & @CRLF & _
'<a name=222222></a><a href="read-htm-tid-222222-fpage-1.html" id="a_ajax_222222" class="subject">yyyyyy</a> ' & "  <span class='gray tpage'>" & @CRLF & _
'<a name=333333></a><a href="read-htm-tid-333333-fpage-1.html" id="a_ajax_333333" class="subject">zzzzzz</a> ' & "  <span class='gray tpage'>"

MsgBox(0, '', $str)
Local $result = StringRegExp($str, 'name=(\d+).+subject">(?:<font[^>]+>)?([^>]+)<', 3)
_ArrayDisplay($result)
 楼主| 发表于 2012-1-29 18:34:41 | 显示全部楼层
回复 2# user3000
非常感谢 在帮助里看到过?:的介绍 ,但是就是没有想到在这里可以这样用,感觉就像是以前背书,能背下来却不知道内容是什么意思,看来还得继续努力理解实践啊。。
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-5-12 03:48 , Processed in 0.074866 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表