laomao127 发表于 2011-2-12 16:25:51

[在线等]正则问题

<TD class=text><A
      href="http://stock1.cf8.com.cn/news/20110212/694251.shtml" target=_blank
      mon="a=5&amp;pn=1"><SPAN><B>2010年12月食品饮料行业零研月报:消费市场追踪</B></SPAN></A> <FONT
      color=#6f6f6f><NOBR>财富赢家 2011-2-12 08:04</NOBR></FONT><BR><FONT
      size=-1><FONT color=#c60a00>伊利</FONT>、蒙牛和光明奶粉零售均价于10
      月环比分别大涨11.8%、17.6%和12.7%,除<FONT color=#c60a00>伊利</FONT>奶粉价格于12
      月出现轻微回调外,蒙牛和光明奶粉价格于四季度逐月环比向上,其中光明奶粉价格于下半年累计上涨40%,在三者中涨幅最大。2)继旺旺乳饮之后,...</FONT>

上面的是网页代码我只做出了 (?s)text\>\<A.+?href="([^"]*)这个 能提取 网页地址 后面的
一、2010年12月食品饮料行业零研月报:消费市场追踪和
二、财富赢家 2011-2-12 08:04和
三、伊利</FONT>、蒙牛和光明奶粉零售均价于10
      月环比分别大涨11.8%、17.6%和12.7%,除<FONT color=#c60a00>伊利</FONT>奶粉价格于12
      月出现轻微回调外,蒙牛和光明奶粉价格于四季度逐月环比向上,其中光明奶粉价格于下半年累计上涨40%,在三者中涨幅最大。2)继旺旺乳饮之后,...
</FONT><FONT color=#c60a00></FONT>这些代码不要

以上三项提取不出来   请高手帮忙 ,谢谢

laomao127 发表于 2011-2-12 16:36:43

请大家帮忙

laomao127 发表于 2011-2-12 17:19:15

高手都不在吗?

auto 发表于 2011-2-12 19:21:32

本帖最后由 auto 于 2011-2-12 21:08 编辑

看错了,删除

水木子 发表于 2011-2-12 20:13:51

用替换模式试试!

(?s)<.+?>

laomao127 发表于 2011-2-12 20:20:17

回复 5# 水木子


    楼上的没明白,替换模式可以吗?不行啊,能用匹配的帮我做一下吗?谢谢

水木子 发表于 2011-2-12 20:24:18

StringRegExpReplace($sText, '(?s)<.+?>', '')

kevinch 发表于 2011-2-12 20:33:21

[^>]+?(?=<)
这个试一下

水木子 发表于 2011-2-12 20:40:31

回复 8# kevinch

貌似并不符合楼主的要求,本该连接的一起的结果被分割开了。

kevinch 发表于 2011-2-12 20:48:34

他要匹配的,然后楼主自己去拼起来吧{:face (411):}

laomao127 发表于 2011-2-12 21:01:38

回复 8# kevinch


    这个不错 ,我在修改一下,谢谢

laomao127 发表于 2011-2-13 08:55:09

还是不怎么好,还有高手能再帮帮忙吗?

水木子 发表于 2011-2-13 09:10:22

用了两步才搞定,纯体力活儿。
抛砖引玉吧!希望能有直接正则搞定的。
#include <Array.au3>
Local $sText = FileRead('Test.txt')

$sRer = StringRegExpReplace($sText, '</FONT>', '')
$aRe = StringRegExp($sRer, '<\w+>([^<]+)|(?<=00>)[^<]+', 3)
_ArrayDisplay($aRe)
页: [1]
查看完整版本: [在线等]正则问题