正则匹配网页所有td标签中的内容
本帖最后由 78391493 于 2009-11-10 11:28 编辑类似<td>grgbeg</td><td>gerhrhethg</td><td>hethgerh</td>
我要匹配出
grgbeg
gerhrhethg
hethgerh
标签数量不定 正则表达式怎么写? <td[^>]*>([^<]+)<\/td>或者<td[^>]*>[^<]+<\/td>难的就不会了哈。 #include <Array.au3>
$str = '<td>grgbeg</td><td>gerhrhethg</td><td>hethgerh</td>'
$ok = StringRegExp($str, '<td>([^/]*)</td>', 3)
If @error = 0 Then _ArrayDisplay($ok, '') 上面的写法兼容所有模式,如果是非贪婪模式,可以这么写<td.*>(.+)</td> StringRegExp(StringReplace($html, @LF, ""), '<tr.*?class=\"SongItem BottomBorder\".*?>([^/]*)<\/tr>', 3)
为什么这样写取不到Google音乐榜单?
http://www.google.cn/music/chartlisting?q=chinese_songs_cn&cat=song&grouping=chinese_music&expanded_groupings=chinese_music '<TD.*\"Title BottomBorder\">.*>([^/]+)</A>'
试下 <tr.+?SongItem BottomBorder.+?>(.+?)</tr>
搞定了~
页:
[1]