[已解决]向大家请教1个正则表达式怎么写,谢谢
本帖最后由 desert2500 于 2014-8-22 10:49 编辑我的目的想把下面的例子中的题中的文本内容提取出来,部分样例见本贴最后附的内容,比如下面这个:
<span id="GridView_paper_Label_question_0">集团公司《关于落实“三重一大”决策制度的实施办法》规定,企业“三重一大”事项集体决策会议讨论时,参加会议人员应充分发表意见,表明态度;主持会议的领导应当执行()制度。</span>
要提取的是<SPAN>标签中的汉字部分,即: 集团公司《关于落实“三重一大”决策制度的实施办法》规定,企业“三重一大”事项集体决策会议讨论时,参加会议人员应充分发表意见,表明态度;主持会议的领导应当执行()制度。
标签中span id="GridView_paper_Label_question_0中最后的数字代表的是序号,我这里一共有200道题。对应的是span id="GridView_paper_Label_question_200,中间其它的题依次按照0-200排序。
对于这个问题,我写出了正则表达式 (?<=<span id="GridView_paper_Label_question_\d">).*(?=</span>)用来匹配span id 中1位数的情况
(?<=<span id="GridView_paper_Label_question_\d\d">).*(?=</span>)用来匹配span id 中2位数的情况
因为我是初学,在网上查资料中发现,零宽断言中不允许出现\d+这样的重复表达式,即 (?<=<span id="GridView_paper_Label_question_\d+">).*(?=</span>) 测试时会出错。
我的问题是:
第一,对于我碰到的问题,请朋友们看一下能不能用1个正则表达式来提取,可能是我的经验比较少,思路不正确。
第二,关于零宽断言中需要重复的情况,应该如何通过别的方法解决。
可能以上两个问题在某些程度上有些重复,请朋友们帮忙解答一下。谢谢了。
附部分样例:
<span id="GridView_paper_Label_question_0">集团公司《关于落实“三重一大”决策制度的实施办法》规定,企业“三重一大”事项集体决策会议讨论时,参加会议人员应充分发表意见,表明态度;主持会议的领导应当执行()制度。</span>
<span id="GridView_paper_Label_question_1">..........
<span id="GridView_paper_Label_question_2">..........
<span id="GridView_paper_Label_question_13">集团公司《关于落实“三重一大”决策制度的实施办法》规定,集体决策事项,应坚持()的原则。出席会议的正式成员有表决权。在讨论重要人事任免时,应参会人员因故不能参加会议的,可以书面形式委托其他班子成员代其发表意见。</span></td>
.........
<span id="GridView_paper_Label_question_200">.......... question_\d+">(.+?)</span>
shqf 发表于 2014-8-22 10:44 http://www.autoitx.com/images/common/back.gif
收到,使用()标示出要提取的内容就可以了,是吧?谢谢
页:
[1]