找回密码
 加入
搜索
查看: 4288|回复: 6

[网络通信] 〔感谢半芯竹,已解决〕请问这个页面中的地址和标题怎么获得,谢谢

  [复制链接]
发表于 2015-1-1 15:42:45 | 显示全部楼层 |阅读模式
本帖最后由 bihex 于 2015-1-1 21:56 编辑

请问这个页面中怎么获得http://item.taobao.com/item.htm?id=41698718109和图片地址和标题【包邮】强力去污玻璃清洁剂
自己搞半天也干不出

对码如下:
<li>
        <div class="main-good buy">
            <a href="http://item.taobao.com/item.htm?id=41698718109" target="_blank" class="good-pic">
               
                <img src="http://img04.taobaocdn.com/imgextra/i4/803616514/TB2MI3ObpXXXXXWXpXXXXXXXXXX_!!803616514.jpg">
               
            </a>
             <span class="new-icon">新品</span>
            
            
            <h3 class="good-title">【包邮】强力去污玻璃清洁剂</a></h3>
            <h4 class="good-price">
                <span class="price-current"><em>¥</em>8.5</span>
                                                <span class="des-other">
                                                        <strong></strong>
                                                        <span class="price-old"><em>¥</em>18</span>
                                                        <span class="discount">(<em>4.7</em>折)</span>
                                                </span>
                <div class="btn-new buy">
                    <a target="_blank" href="http://item.taobao.com/item.htm?id=41698718109">
                        <strong>去天猫抢购</strong>
                    </a>
                </div>
            </h4>
            <h5 class="des-state">
                <span class="state-time fl">开始:1月1日10时00分</span>
            </h5>
        </div>
    </li>
 楼主| 发表于 2015-1-1 18:38:17 | 显示全部楼层
回复 1# bihex


    $sImg = StringRegExp($str, '.*(http://im.+?jpg).*class="title">(.+?)</.*(http://.+?)".*', 3)
用这个无法获得内容
发表于 2015-1-1 20:10:40 | 显示全部楼层
本帖最后由 半芯竹 于 2015-1-1 20:16 编辑

[a-zA-z]+://[^\s]*(\.jpg|\d{11})|([^\x00-\xff]+){13}

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
 楼主| 发表于 2015-1-1 21:56:07 | 显示全部楼层
太厉害了,
发表于 2015-1-2 08:30:38 | 显示全部楼层
学习了。。。。。。。。
发表于 2015-1-3 17:43:46 | 显示全部楼层
本帖最后由 半芯竹 于 2015-1-3 18:09 编辑

\w+://[^\s]*(\d+|\.jpg)|[^\x00-\xff]{13}

如果只需要提取一个:“http://item.taobao.com/item.htm?id=41698718109
\w+://[^\s]*(\d+(?=">)|\.jpg)|[^\x00-\xff]{13}

添加一个正则预搜索。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
 楼主| 发表于 2015-1-6 13:25:30 | 显示全部楼层
能够把3个放在一个数组里面吗
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-12-28 05:42 , Processed in 0.130029 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表