Sooloom 发表于 2009-9-24 08:40:56

这样的网页源码里的文字怎么获取?

<DIV class=clear></DIV></DIV>
<DIV class=tongji></DIV>
<DIV class=clear></DIV>
<DIV class=intro>
<H1>影片介绍</H1>
<DIV class=cont>承接上辑情节,DIE在朗领导下,屡破奇案,最终得以“光荣解散”,除了晶晶暂放产假、费SIR退休回到老家苏格兰外,其余众人亦重返以前之工作岗位。不过,众人骑呢性格、作风不变,继续令上司们头痛不已,于工作上备受排斥!  一次大型官方活动,前DIE众人因不同原因齐集现场执行任务,刚好带着BB于附近经过的晶,因惯性捉拿正在从事不法勾当之死敌大口英,而误闯禁区,引起了连串骨牌效应,众人鸡手鸭脚,竟令警队一哥出丑当场…一哥责难下来,警队高层召开紧急会议,朗之顶头上司罗有恒为了再次踢走麻烦下属,主动提出重组DIE,将这班麻烦多多、却是无法炒鱿的废柴再度集中一起,任其自生自灭,但由于DIE原主管费SIR已退休,恒竟被众人摆上台,被逼接受主管DIE之重任。</DIV>
<DIV class=btstyle></DIV></DIV></DIV>
<DIV class=clear></DIV>
<DIV class=btstyle></DIV></DIV>

取其中的文本怎么取?

顽固不化 发表于 2009-9-24 09:16:09

$FHD=FileOpen("11.txt",0)
$TXTs=FileRead($FHD)
FileClose($FHD)

$TxtLins=StringSplit($TXTs,@CRLF,1)
for $i=1 To $TxtLins
        If StringInStr($TxtLins[$i],"<DIV class=cont>") Then
                $TXT=StringTrimLeft(StringTrimRight($TxtLins[$i],6),16)
                ExitLoop
        EndIf
Next
if $TXT<>"" Then MsgBox(0,0,$TXT)11.txt内容:
<DIV class=clear></DIV></DIV>
<DIV class=tongji></DIV>
<DIV class=clear></DIV>
<DIV class=intro>
<H1>影片介绍</H1>
<DIV class=cont>承接上辑情节,DIE在朗领导下,屡破奇案,最终得以“光荣解散”,除了晶晶暂放产假、费SIR退休回到老家苏格兰外,其余众人亦重返以前之工作岗位。不过,众人骑呢性格、作风不变,继续令上司们头痛不已,于工作上备受排斥!  一次大型官方活动,前DIE众人因不同原因齐集现场执行任务,刚好带着BB于附近经过的晶,因惯性捉拿正在从事不法勾当之死敌大口英,而误闯禁区,引起了连串骨牌效应,众人鸡手鸭脚,竟令警队一哥出丑当场…一哥责难下来,警队高层召开紧急会议,朗之顶头上司罗有恒为了再次踢走麻烦下属,主动提出重组DIE,将这班麻烦多多、却是无法炒鱿的废柴再度集中一起,任其自生自灭,但由于DIE原主管费SIR已退休,恒竟被众人摆上台,被逼接受主管DIE之重任。</DIV>
<DIV class=btstyle></DIV></DIV></DIV>
<DIV class=clear></DIV>
<DIV class=btstyle></DIV></DIV>

bob 发表于 2009-9-24 12:53:05

上面的改成正则

$FHD=FileOpen("11.txt",0)
$TXTs=FileRead($FHD)
FileClose($FHD)

$TXT=StringRegExp($TXTs,'<DIV class=cont>(.*?)</DIV>',3)

if $TXT<>"" Then MsgBox(0,0,$TXT)

afan 发表于 2009-9-24 13:06:14

$TXTs=FileRead('11.txt')
$TXT=StringRegExp($TXTs,'<DIV class=cont>(.+)</DIV>',3)
if Not @Error Then MsgBox(0,0,$TXT)

sxd 发表于 2009-9-24 13:06:21

都会错意了楼主要的文 在网页内获取

gto250 发表于 2009-9-25 22:59:58

有什么区别吗?读取网页内容,写入文本,再进行提取。或者读取网页内容到内容,再进行提取


http://lwc.nhome.cn/code/showip.asp

sxd 发表于 2009-9-26 00:43:32

他说的应该是通过 ie.au3来获取
或者他不知道 如何从一个url获取源代码
页: [1]
查看完整版本: 这样的网页源码里的文字怎么获取?