找回密码
 加入
搜索
查看: 5583|回复: 2

[AU3基础] [已解决]向大家请教1个正则表达式怎么写,谢谢

[复制链接]
发表于 2014-8-22 10:18:34 | 显示全部楼层 |阅读模式
本帖最后由 desert2500 于 2014-8-22 10:49 编辑

我的目的想把下面的例子中的题中的文本内容提取出来,部分样例见本贴最后附的内容,比如下面这个:
<span id="GridView_paper_Label_question_0">集团公司《关于落实“三重一大”决策制度的实施办法》规定,企业“三重一大”事项集体决策会议讨论时,参加会议人员应充分发表意见,表明态度;主持会议的领导应当执行()制度。</span>
要提取的是<SPAN>标签中的汉字部分,即:    集团公司《关于落实“三重一大”决策制度的实施办法》规定,企业“三重一大”事项集体决策会议讨论时,参加会议人员应充分发表意见,表明态度;主持会议的领导应当执行()制度。

标签中span id="GridView_paper_Label_question_0中最后的数字代表的是序号,我这里一共有200道题。对应的是span id="GridView_paper_Label_question_200,中间其它的题依次按照0-200排序。

对于这个问题,我写出了正则表达式        (?<=<span id="GridView_paper_Label_question_\d">).*(?=</span>)  用来匹配span id 中1位数的情况
                                        (?<=<span id="GridView_paper_Label_question_\d\d">).*(?=</span>)  用来匹配span id 中2位数的情况

因为我是初学,在网上查资料中发现,零宽断言中不允许出现\d+这样的重复表达式,即 (?<=<span id="GridView_paper_Label_question_\d+">).*(?=</span>) 测试时会出错。

我的问题是:
第一,对于我碰到的问题,请朋友们看一下能不能用1个正则表达式来提取,可能是我的经验比较少,思路不正确。
第二,关于零宽断言中需要重复的情况,应该如何通过别的方法解决。

可能以上两个问题在某些程度上有些重复,请朋友们帮忙解答一下。谢谢了。

附部分样例:
<span id="GridView_paper_Label_question_0">集团公司《关于落实“三重一大”决策制度的实施办法》规定,企业“三重一大”事项集体决策会议讨论时,参加会议人员应充分发表意见,表明态度;主持会议的领导应当执行()制度。</span>
<span id="GridView_paper_Label_question_1">..........
<span id="GridView_paper_Label_question_2">..........
<span id="GridView_paper_Label_question_13">集团公司《关于落实“三重一大”决策制度的实施办法》规定,集体决策事项,应坚持()的原则。出席会议的正式成员有表决权。在讨论重要人事任免时,应参会人员因故不能参加会议的,可以书面形式委托其他班子成员代其发表意见。</span></td>
.........
<span id="GridView_paper_Label_question_200">..........
发表于 2014-8-22 10:44:13 | 显示全部楼层
question_\d+">(.+?)</span>
 楼主| 发表于 2014-8-22 10:47:52 | 显示全部楼层
shqf 发表于 2014-8-22 10:44



收到,使用()标示出要提取的内容就可以了,是吧?谢谢
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-9-28 06:22 , Processed in 0.207189 second(s), 22 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表