sex123 发表于 2012-12-20 23:26:18

回复sex123


    类似问题,竟然发了3个帖子,太不应该了.
为了不打击你的学习劲头,姑且回复一个吧. ...
user3000 发表于 2012-12-20 20:59 http://www.autoitx.com/images/common/back.gif

不是我要求的那样,我要的是23181270这个数字,不同的网页,这个数字是不同的,我要的是数字,不是整个字符串,另外我看你已经把23181270这个数写到正则里面了吧,我根本不知道这个数字在网页中会是什么,而我只是想得到这个数字。自学很难的,网上的教程又很少。我再看看吧。

annybaby 发表于 2012-12-20 23:38:32

回复 16# sex123

http://www.autoitx.com/forum.php?mod=viewthread&tid=36355&fromuid=7652266

小影 发表于 2012-12-21 15:54:31

回复 11# sex123
两个连接的也给你弄出来了!!
Local $html=BinaryToString(InetRead("http://www.ncbi.nlm.nih.gov/pubmed/23152893"))
Local $strrg=StringRegExp($html,'<div><a href="'&'([^"]+)"\s*ref="'&'PrId=\d+.+<a\s*href="'&'([^"]+)', 3)
If Not @error Then MsgBox(0, '', $strrg&@CRLF&$strrg)

qq362817567 发表于 2012-12-21 18:57:03

#include <array.au3>
#include <inet.au3>
$source = _INetGetSource("http://www.ncbi.nlm.nih.gov/pubmed/23152893")
$source = StringRegExp($source, '(?<=icons|png)[^=]+="([^"]+)', 3)
_ArrayDisplay($source)
也可以

javarike 发表于 2012-12-23 23:27:42

{:face (125):}可以了吧

shqf 发表于 2012-12-27 12:45:55

#include <array.au3>
#include <inet.au3>
For $pmid = 124321 To 124330
        $medlineurl = "http://www.ncbi.nlm.nih.gov/pubmed/" & $pmid
        ToolTip("正在读取" & '"' & $medlineurl & '"网页源码,请稍候...' & @CR, 200, 200)
        $source = _INetGetSource($medlineurl)
        $urlhtml = StringRegExp($source, '(<div class="icons">.+</div></div>)', 3)
        If @error = 1 Then
                ToolTip("网页地址:" & $medlineurl & @CR & "该网页没有你要的链接。", 200, 200)
                Sleep(2000)
        Else
                $urls = StringRegExp($urlhtml, 'href="(http://.+?)"', 3)
                Local $urltext = ""
                For $i = 0 To UBound($urls) - 1
                        $url = StringReplace($urls[$i], "amp;", '')
                        $urltext = $urltext & $url & @CRLF
                Next
                ToolTip("网页地址:" & $medlineurl & @CR & "该网页存在你所需要的链接:" & @CR & $urltext, 200, 200)
                Sleep(4000)
        EndIf
Next
页: 1 [2]
查看完整版本: 如何读取一个网页的一个特定的网页链接呢?