afan 发表于 2011-11-17 11:55:07

回复 12# xms77


    有兴趣就好了,至于处于哪个阶段,能解决问题就Ok~

这个表达式其实很简单:
(?<=>)[^<\v"{}]+(?=<)

蓝色部分是指定匹配的前面及后面的位置。
中间的桔黄色就是要捕获的部分,“[] ”框起来的就是需要匹配的单字符要求,后面的“+”就是指这些单字符要不间断的匹配1个以上。“^”在“[]”外面的话它是匹配字符串的开始位置,而在“[]”里面就是指排除的意思,即排除“^”后面的任意表达式,这里就是要排除“<”“\v”“"”“{”“}”

xms77 发表于 2011-11-17 12:24:48

回复 16# afan
感谢afan解惑,受益不浅!

lixiaolong 发表于 2011-11-17 13:32:23

回复 14# newuser

现在我能看懂了一些,但是不太会用,我建议大家多出点正则的题目,大家一起练习!
正则太有趣了!

newuser 发表于 2011-11-17 16:21:59

回复 18# lixiaolong
实践出真知,不过,我觉得如果有日常计算机小工具能用到正则的例子,更能激励学习,向我,年初认真学了一段时间,感觉对正则有点入门的意思,可是因为今年单位忙,其实自己也懒,现在又对正则不知所云了,真的很郁闷!

kood481748 发表于 2011-11-21 22:44:59

原来楼主想做一个作蔽程序啊
页: 1 [2]
查看完整版本: 求教正则提取网页文字 [已解决]