afan 发表于 2011-11-25 19:24:42

回复afan

    5楼的:'>(\s.*?)
卫和谐 发表于 2011-11-25 19:22 http://www.autoitx.com/images/common/back.gif

很明显,你的源字符串与贴出来的不一样。

lixiaolong 发表于 2011-11-25 19:26:56

本帖最后由 lixiaolong 于 2011-11-25 19:28 编辑

回复 13# 卫和谐

这个可以吗?
>\h+([^<\r\n]+)<

这个也行.
>\h+([^<]+)<

afan 发表于 2011-11-25 19:28:13

把你获取源码的地方插一句输出到.txt文本,再贴出来,多取些字符,便于找特征。

卫和谐 发表于 2011-11-25 19:33:16

回复 17# lixiaolong


    要求分开来提取.....

卫和谐 发表于 2011-11-25 19:37:27

本帖最后由 卫和谐 于 2011-11-25 21:48 编辑

回复 18# afan

就像投票网址,提取投票结果一样!

lixiaolong 发表于 2011-11-25 19:37:33

回复 19# 卫和谐

是这个意思吗?

第一个
>\h+([^<\d]*)<

第二个
>\h+(\W*)<

afan 发表于 2011-11-25 19:39:26

没看那个网址,先试试>\h*(?:&nbsp;)*([^<]+)</td>\s*</tr>

卫和谐 发表于 2011-11-25 19:44:02

回复 21# lixiaolong


    不行,两个都不行!

卫和谐 发表于 2011-11-25 19:44:18

回复 22# afan


    试过了,也不行!

afan 发表于 2011-11-25 19:44:59

回复 24# 卫和谐


    我看了那个源码,完全不是一回事……

卫和谐 发表于 2011-11-25 19:46:40

回复 25# afan


    这个/这个,我不太明白.....

afan 发表于 2011-11-25 19:57:59

(?s)k">([^<]+)</a><br />.+?区域.+?>\s*(?:&nbsp;)*(\d+票)<

afan 发表于 2011-11-25 20:06:12

(?s)k">([^<]+)</a><br />.+?区域(?s)区域.+?>\s*(?:&nbsp;)*\s*(\d+票)<

卫和谐 发表于 2011-11-25 20:07:26

回复 27# afan


    怎么我得出的结果和你不一样?

lixiaolong 发表于 2011-11-25 20:08:31

本帖最后由 lixiaolong 于 2011-11-25 21:41 编辑

回复 23# 卫和谐

一楼的源码和18楼(错了,是20楼)的完全不一样...

第一个
<a.+>([^<]+[所队室])<

第二个
\d+票
页: 1 [2] 3 4
查看完整版本: [已解决]这个网页中的内容用正则怎么提取