shano 发表于 2010-11-12 23:22:10

网页内容抓取 求一正则(已解决)

本帖最后由 shano 于 2010-11-13 01:18 编辑

$Source = _INetGetSource("http://switchboard.intelius.com/results.php?ReportType=34&qn=Mcconnell&qi=20&qk=10")


抓出格式为一条记录为

Box 1735
Wise
VA
24293
(276) 328-3522



一页共10条信息

----------------------------------------------------------------------------------------------------------------------------------
源码如下

    <td class="result" colspan="2">
   <table class="resultTable">
      <tr>
         <td class="nameAndAddress">
            
   <div><a class="resultName" href="/results.php?ReportType=34&MoreInfoResult=1&RecID=0&qi=20&qk=10&qn=Mcconnell">A Mcconnell</a></div>
   <div class="listingInfo">
         <div>Box 1735<br> Wise, VA 24293</div>
         <div class="phone">(276) 328-3522</div></div>
   <div><a class="leftUrl" href="/vcard.php?city=Wise&amp;state=VA&amp;address=Box+1735&amp;zip=24293&amp;fname=A&amp;lname=Mcconnell&amp;phone=2763283522&amp;email=">Add to Address Book</a


-----------------------------------------------------------------------

最佳答案<div>([^<]+)<br>\s*(\w+)[,\s]+(\w+)\s(\w+)</div>\v\s*<div class="phone">([^<]+)

binghc 发表于 2010-11-12 23:48:43

本帖最后由 binghc 于 2010-11-12 23:56 编辑

啊~可能我不是非常懂网页,不明白楼主的意思

刚才研究了下,有点明白了。。。。。

shano 发表于 2010-11-12 23:59:56

贴出源码了

binghc 发表于 2010-11-13 00:23:12

本帖最后由 binghc 于 2010-11-13 00:58 编辑

<div>([^<]+)<br>\s*([^,]+)[,\s]+(\w+)\s(\w+)</div>\v\s*<div class="phone">([^<]+)

这可是楼主想要的答案?




shano 发表于 2010-11-13 00:31:42

哈哈没错
LS的徘徊在牛A和牛C之间。。。。。

binghc 发表于 2010-11-13 00:42:16

哈哈没错
LS的徘徊在牛A和牛C之间。。。。。
shano 发表于 2010-11-13 00:31 http://www.autoitx.com/images/common/back.gif


    什么意思哈?

shano 发表于 2010-11-13 00:44:24

问题来了

$Source = _INetGetSource("http://switchboard.intelius.com/results.php?ReportType=34&qn=Mcconnell&qi=20&qk=10")
$sR = StringRegExp($Source, '<div>([^<]+)<br>\s*(\w+)[,\s]+(\w+)\s(\w+)</div>\r\s*<div class="phone">([^<]+)',3)
_ArrayDisplay($sR, UBound($sR))

这样为何匹配不到?

binghc 发表于 2010-11-13 00:51:12

问题出在那个换行符上,你把\r后面的表达式删除试试看!

binghc 发表于 2010-11-13 00:53:42

把\r换成\v,就没问题了

Netfox 发表于 2011-1-14 00:36:45

经曲吗。牛A与牛C的牛B

Netfox 发表于 2011-1-14 09:12:27

哈哈哈。。。。

Netfox 发表于 2011-1-19 20:32:53

不错的东东。。。

都市浪子666 发表于 2011-1-20 12:04:53

什么意思哈?
binghc 发表于 2010-11-13 00:42 http://www.autoitx.com/images/common/back.gif



{:face (303):}
A 和C中间隔了一个B字呀,,那就是牛B了

yao_rc301 发表于 2012-1-4 17:07:25

这个/r与/v找了好久。。。。
页: [1]
查看完整版本: 网页内容抓取 求一正则(已解决)