找回密码
 加入
搜索
楼主: tsys

[效率算法] 求教正则提取网页文字 [已解决]

 火.. [复制链接]
发表于 2011-11-17 11:55:07 | 显示全部楼层
回复 12# xms77


    有兴趣就好了,至于处于哪个阶段,能解决问题就Ok~

这个表达式其实很简单:
(?<=>)[^<\v"{}]+(?=<)

蓝色部分是指定匹配的前面及后面的位置。
中间的桔黄色就是要捕获的部分,“[] ”框起来的就是需要匹配的单字符要求,后面的“+”就是指这些单字符要不间断的匹配1个以上。“^”在“[]”外面的话它是匹配字符串的开始位置,而在“[]”里面就是指排除的意思,即排除“^”后面的任意表达式,这里就是要排除“<”“\v”“"”“{”“}”

评分

参与人数 1金钱 +40 贡献 +5 收起 理由
xms77 + 40 + 5 感谢解惑!

查看全部评分

发表于 2011-11-17 12:24:48 | 显示全部楼层
回复 16# afan
感谢afan解惑,受益不浅!
发表于 2011-11-17 13:32:23 | 显示全部楼层
回复 14# newuser

现在我能看懂了一些,但是不太会用,我建议大家多出点正则的题目,大家一起练习!
正则太有趣了!
发表于 2011-11-17 16:21:59 | 显示全部楼层
回复 18# lixiaolong
实践出真知,不过,我觉得如果有日常计算机小工具能用到正则的例子,更能激励学习,向我,年初认真学了一段时间,感觉对正则有点入门的意思,可是因为今年单位忙,其实自己也懒,现在又对正则不知所云了,真的很郁闷!
发表于 2011-11-21 22:44:59 | 显示全部楼层
原来楼主想做一个作蔽程序啊
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-11-6 09:45 , Processed in 0.073606 second(s), 15 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表