找回密码
 加入
搜索
查看: 1600|回复: 5

[网络通信] 如何把网页的文本提取出来(问题解决感谢)

[复制链接]
发表于 2017-10-10 23:05:28 | 显示全部楼层 |阅读模式
本帖最后由 dingwanz 于 2017-10-11 17:44 编辑

例如打开http://2017.ip138.com/ic.asp
想把这里边“您的IP是:[134.197.15.105] 来自:河南省XX市 联通“--这些提取出来保存到一个TXT文档里边,谢谢谢谢

看这个贴http://www.autoitx.com/forum.php ... &from=favorites自己太菜 不会修改 特来请教
发表于 2017-10-11 13:18:15 | 显示全部楼层
如果你能获取到这些网页源码  就用正则提取就好了、。
发表于 2017-10-11 13:25:33 | 显示全部楼层
本帖最后由 heroxianf 于 2017-10-11 13:26 编辑

假设你知道怎么获取源码就可以这样简单提取。


Local $Date = "<html>" & _
'<head>' & _
'<meta http-equiv="content-type" content="text/html; charset=gb2312">' & _
'<title> 您的IP地址 </title>' & _
'</head>' & _
'<body style="margin:0px"><center>您的IP是:[202.211.156.167] 来自:XXX 电信</center></body></html>'

Local $Date_Out = StringRegExp($Date, '<center>(.*?)</center>', 3)
MsgBox(0, "", $Date_Out[0])
 楼主| 发表于 2017-10-11 17:43:37 | 显示全部楼层
#include <Inet.au3>
#include<IE.au3>
#AutoIt3Wrapper_UseX64=n
Dim $url_get_info = "http://2017.ip138.com/ic.asp "

$Date = BinaryToString(InetRead($url_get_info,1))

Local $Date_Out = StringRegExp($Date, '<center>(.*?)</center>', 3)
MsgBox(0, "", $Date_Out[0])

谢谢heroxianf 成功了
发表于 2017-10-14 16:28:28 | 显示全部楼层
回复 4# dingwanz

請看板規  解決了請修改標題
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-3-28 18:25 , Processed in 0.069915 second(s), 19 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表