找回密码
 加入
搜索
查看: 5009|回复: 13

[系统综合] 网页内容抓取 求一正则(已解决)

  [复制链接]
发表于 2010-11-12 23:22:10 | 显示全部楼层 |阅读模式
本帖最后由 shano 于 2010-11-13 01:18 编辑

$Source = _INetGetSource("http://switchboard.intelius.com/results.php?ReportType=34&qn=Mcconnell&qi=20&qk=10")


抓出格式为  一条记录为

Box 1735
Wise
VA
24293
(276) 328-3522



一页共10条信息

----------------------------------------------------------------------------------------------------------------------------------
源码如下

    <td class="result" colspan="2">
   <table class="resultTable">
      <tr>
         <td class="nameAndAddress">
            
   <div><a class="resultName" href="/results.php?ReportType=34&MoreInfoResult=1&RecID=0&qi=20&qk=10&qn=Mcconnell">A Mcconnell</a></div>
   <div class="listingInfo">
         <div>Box 1735<br> Wise, VA 24293</div>
         <div class="phone">(276) 328-3522</div></div>
   <div><a class="leftUrl" href="/vcard.php?city=Wise&amp;state=VA&amp;address=Box+1735&amp;zip=24293&amp;fname=A&amp;lname=Mcconnell&amp;phone=2763283522&amp;email=">Add to Address Book</a


-----------------------------------------------------------------------

最佳答案  <div>([^<]+)<br>\s*(\w+)[,\s]+(\w+)\s(\w+)</div>\v\s*<div class="phone">([^<]+)

评分

参与人数 1金钱 +10 收起 理由
afan + 10 感谢主动将修改帖子分类为[已解决],请继续 ...

查看全部评分

发表于 2010-11-12 23:48:43 | 显示全部楼层
本帖最后由 binghc 于 2010-11-12 23:56 编辑

啊~可能我不是非常懂网页,不明白楼主的意思

刚才研究了下,有点明白了。。。。。
 楼主| 发表于 2010-11-12 23:59:56 | 显示全部楼层
贴出源码了
发表于 2010-11-13 00:23:12 | 显示全部楼层
本帖最后由 binghc 于 2010-11-13 00:58 编辑

<div>([^<]+)<br>\s*([^,]+)[,\s]+(\w+)\s(\w+)</div>\v\s*<div class="phone">([^<]+)

这可是楼主想要的答案?




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×

评分

参与人数 1金钱 +25 收起 理由
afan + 25

查看全部评分

 楼主| 发表于 2010-11-13 00:31:42 | 显示全部楼层
哈哈  没错  
LS的徘徊在牛A和牛C之间。。。。。
发表于 2010-11-13 00:42:16 | 显示全部楼层
哈哈  没错  
LS的徘徊在牛A和牛C之间。。。。。
shano 发表于 2010-11-13 00:31



    什么意思哈?
 楼主| 发表于 2010-11-13 00:44:24 | 显示全部楼层
问题来了

$Source = _INetGetSource("http://switchboard.intelius.com/results.php?ReportType=34&qn=Mcconnell&qi=20&qk=10")
$sR = StringRegExp($Source, '<div>([^<]+)<br>\s*(\w+)[,\s]+(\w+)\s(\w+)</div>\r\s*<div class="phone">([^<]+)',3)
_ArrayDisplay($sR, UBound($sR))

这样为何匹配不到?
发表于 2010-11-13 00:51:12 | 显示全部楼层
问题出在那个换行符上,你把\r后面的表达式删除试试看!
发表于 2010-11-13 00:53:42 | 显示全部楼层
把\r换成\v,就没问题了
发表于 2011-1-14 00:36:45 | 显示全部楼层
经曲吗。牛A与牛C的牛B
发表于 2011-1-14 09:12:27 | 显示全部楼层
哈哈哈。。。。
发表于 2011-1-19 20:32:53 | 显示全部楼层
不错的东东。。。
发表于 2011-1-20 12:04:53 | 显示全部楼层
什么意思哈?
binghc 发表于 2010-11-13 00:42





A 和C中间  隔了一个B字呀,,那就是牛B了
发表于 2012-1-4 17:07:25 | 显示全部楼层
这个/r与/v找了好久。。。。
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-10-1 01:23 , Processed in 0.082603 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表