找回密码
 加入
搜索
查看: 4250|回复: 6

这样的网页源码里的文字怎么获取?

[复制链接]
发表于 2009-9-24 08:40:56 | 显示全部楼层 |阅读模式
<DIV class=clear></DIV></DIV>
<DIV class=tongji></DIV>
<DIV class=clear></DIV>
<DIV class=intro>
<H1>影片介绍</H1>
<DIV class=cont>承接上辑情节,DIE在朗领导下,屡破奇案,最终得以“光荣解散”,除了晶晶暂放产假、费SIR退休回到老家苏格兰外,其余众人亦重返以前之工作岗位。不过,众人骑呢性格、作风不变,继续令上司们头痛不已,于工作上备受排斥!  一次大型官方活动,前DIE众人因不同原因齐集现场执行任务,刚好带着BB于附近经过的晶,因惯性捉拿正在从事不法勾当之死敌大口英,而误闯禁区,引起了连串骨牌效应,众人鸡手鸭脚,竟令警队一哥出丑当场…一哥责难下来,警队高层召开紧急会议,朗之顶头上司罗有恒为了再次踢走麻烦下属,主动提出重组DIE,将这班麻烦多多、却是无法炒鱿的废柴再度集中一起,任其自生自灭,但由于DIE原主管费SIR已退休,恒竟被众人摆上台,被逼接受主管DIE之重任。</DIV>
<DIV class=btstyle></DIV></DIV></DIV>
<DIV class=clear></DIV>
<DIV class=btstyle></DIV></DIV>

取其中的文本怎么取?
发表于 2009-9-24 09:16:09 | 显示全部楼层
$FHD=FileOpen("11.txt",0)
$TXTs=FileRead($FHD)
FileClose($FHD)

$TxtLins=StringSplit($TXTs,@CRLF,1)
for $i=1 To $TxtLins[0]
        If StringInStr($TxtLins[$i],"<DIV class=cont>") Then
                $TXT=StringTrimLeft(StringTrimRight($TxtLins[$i],6),16)
                ExitLoop
        EndIf
Next
if $TXT<>"" Then MsgBox(0,0,$TXT)
11.txt内容:
<DIV class=clear></DIV></DIV>
<DIV class=tongji></DIV>
<DIV class=clear></DIV>
<DIV class=intro>
<H1>影片介绍</H1>
<DIV class=cont>承接上辑情节,DIE在朗领导下,屡破奇案,最终得以“光荣解散”,除了晶晶暂放产假、费SIR退休回到老家苏格兰外,其余众人亦重返以前之工作岗位。不过,众人骑呢性格、作风不变,继续令上司们头痛不已,于工作上备受排斥!  一次大型官方活动,前DIE众人因不同原因齐集现场执行任务,刚好带着BB于附近经过的晶,因惯性捉拿正在从事不法勾当之死敌大口英,而误闯禁区,引起了连串骨牌效应,众人鸡手鸭脚,竟令警队一哥出丑当场…一哥责难下来,警队高层召开紧急会议,朗之顶头上司罗有恒为了再次踢走麻烦下属,主动提出重组DIE,将这班麻烦多多、却是无法炒鱿的废柴再度集中一起,任其自生自灭,但由于DIE原主管费SIR已退休,恒竟被众人摆上台,被逼接受主管DIE之重任。</DIV>
<DIV class=btstyle></DIV></DIV></DIV>
<DIV class=clear></DIV>
<DIV class=btstyle></DIV></DIV>
发表于 2009-9-24 12:53:05 | 显示全部楼层
上面的改成正则

$FHD=FileOpen("11.txt",0)
$TXTs=FileRead($FHD)
FileClose($FHD)

$TXT=StringRegExp($TXTs,'<DIV class=cont>(.*?)</DIV>',3)

if $TXT[0]<>"" Then MsgBox(0,0,$TXT[0])
发表于 2009-9-24 13:06:14 | 显示全部楼层
$TXTs=FileRead('11.txt')
$TXT=StringRegExp($TXTs,'<DIV class=cont>(.+)</DIV>',3)
if Not @Error Then MsgBox(0,0,$TXT[0])
发表于 2009-9-24 13:06:21 | 显示全部楼层
都会错意了  楼主要的文 在网页内获取
发表于 2009-9-25 22:59:58 | 显示全部楼层
有什么区别吗?读取网页内容,写入文本,再进行提取。或者读取网页内容到内容,再进行提取


发表于 2009-9-26 00:43:32 | 显示全部楼层
他说的应该是通过 ie.au3来获取
或者他不知道 如何从一个url获取源代码
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-9-22 20:33 , Processed in 0.077847 second(s), 22 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表