找回密码
 加入
搜索
查看: 2691|回复: 7

[AU3基础] [已解决]使用正则从网页中提取文字

  [复制链接]
发表于 2011-11-25 09:23:20 | 显示全部楼层 |阅读模式
本帖最后由 magus 于 2011-11-25 09:46 编辑

<ul class="wb_news_list"> <li><a href="http://weibo.com/1780168271/xyNdp9L6l">旺夫的6种肉类</a></li> <li><a href="http://v.tao123.com/dianying/">吸血鬼上演血色情欲</a></li> <li><a href="http://www.tao123.com/shenghuo/meinv/?top1">全裸美女</a>&nbsp;<a href="http://www.tao123.com/shenghuo/meinv/?top">透视装</a></li> </ul> </div>

我是Au3新手,对正则几乎一窍不通,请问如何从这一段网页中提取出这四个汉字标题?
发表于 2011-11-25 09:39:46 | 显示全部楼层
回复 1# magus
是这样吗?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×

评分

参与人数 1金钱 +20 收起 理由
magus + 20 感谢!

查看全部评分

 楼主| 发表于 2011-11-25 09:46:00 | 显示全部楼层
完美...
发表于 2011-11-25 09:49:46 | 显示全部楼层
回复 3# magus
#include <Array.au3>
$sText = '<ul class="wb_news_list"> <li><a href="http://weibo.com/1780168271/xyNdp9L6l">旺夫的6种肉类</a></li> <li><a href="http://v.tao123.com/dianying/">吸血鬼上演血色情欲</a></li> <li><a href="http://www.tao123.com/shenghuo/meinv/?top1">全裸美女</a> <a href="http://www.tao123.com/shenghuo/meinv/?top">透视装</a></li> </ul> </div>'

$aRe = StringRegExp($sText, '(?<=">)([^<]+)</a>', 3)
_ArrayDisplay($aRe)
发表于 2011-11-25 10:16:07 | 显示全部楼层
学习了,2楼用的是什么工具
发表于 2011-11-25 10:31:57 | 显示全部楼层
回复 5# y1751


    论坛里面有这个工具下载,自己搜一下“正则”...配合AU3挺好用的!..
发表于 2011-11-25 15:24:17 | 显示全部楼层
只提取四个汉字标题.
(?<=>)\W{4}(?=<)
发表于 2011-11-25 17:04:44 | 显示全部楼层
本帖最后由 131738 于 2011-11-25 17:18 编辑
回复  magus
水木子 发表于 2011-11-25 09:49


准备收入 StringRegExp 示例脚本,描述为 “正则提取网页文字”,当然少不了作者和链接, 呵呵。。。
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-12-24 07:11 , Processed in 0.114437 second(s), 28 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表