Afan斑竹,关于正则表达式的一个问题!截取指定内容从网页源文件中.(已解决)
本帖最后由 yiruirui 于 2010-11-22 23:53 编辑http://www.youxi777.com/game/mefdjakfdjls.html
从这个网页中提取两部分内容:分别如下:
1.
<div id="center1">
<div class="column6">
<table width="950" border="0" cellspacing="0" cellpadding="0">
<tr>
<td height="39" colspan="4" background="/img/class_top2.gif" class="top"><strong><h1>雀美眉写真馆麻将</h1></strong></td>
</tr>
<tr>
<td background="/img/class_bg2.gif"><table width="950" border="0" cellspacing="0" cellpadding="0">
<tr>
<td height="12" colspan="4"></td>
</tr>
<tr>
<td width="2%" rowspan="8"> </td>
<td>
<ul>
<li>游戏类型:休闲益智</li>
<li>游戏语言:简体中文</li>
<li>游戏大小:62.80M</li>
<li>运行环境:Win2003/WinXP/Win2000/Win9X/</li>
<li>官方站点:<a href="" target="_blank" rel="nofollow">点击访问</a></li>
<li>整理时间:2009-01-10</li>
<li>下载次数:</li>
</ul></td>
<td width="37%" align="center" valign="middle"class="img_border2"><a href="/game_img/mefdjakfdjls_b.jpg" target="_blank" title="雀美眉写真馆麻将"><img src="/game_img/mefdjakfdjls.jpg" width="300" height="200" onmousemove="this.className='img_border2'" onmouseout="this.className=''"alt="雀美眉写真馆麻将" /></a></td>
<td width="2%" rowspan="8"> </td>
</tr>
2.(这里是我手动修改过的,能截取到游戏简介就OK,剩下的可以写代码判断也没问题的)
<tr>
<td valign="top" background="/img/detail_tdbg1.gif">
<div class="detail_box">
<div class="detail_title1">【雀美眉写真馆麻将游戏简介】</div>
<div class="detail">
<p>游戏既然以写真美眉为主题,漂亮可爱的美女在游戏里出现自然是免不了的,研发组为了带给玩家热情、养眼的感受,总共精心设定了5名美女与玩家对战。这些美女,即像从真实社会中所筛选出来的,各有其不同的身份与个人的身家资料。当然,依其个人的资料,其所发挥的特长跟战力也是各自不同。</p>
</div>
</div>
</tr>
你考虑考虑看能满足吗?3Q! 总共两部分,一部分是游戏的信息,另外一部分是游戏的介绍.
手动截取的效果如图:
本帖最后由 水木子 于 2010-11-22 16:38 编辑
<li>([^:]+):([^<]*) 回复 3# 水木子
感谢水木斑竹!你误会我的意思了,我的意思是截取网页中的内容,结果为我上面的那两部分.抱歉,我的表达能力不够.... 回复 4# yiruirui
呵呵!抱歉啊!理解错误,让我们共同期待正解吧! (?s)(<div id="center1".+?alt=".+?/tr>)(?=\v\s+<tr>).+?(<tr>\v\s+<td valign=.+?/p>.+?)(?=\v\s+<\w)刚上来就整这个纯体力活,以后LZ还是自己慢慢调试吧~_ _||| 回复 6# afan
非常感谢A版主,谢谢~
页:
[1]