dingwanz 发表于 2017-10-10 23:05:28

如何把网页的文本提取出来(问题解决感谢)

本帖最后由 dingwanz 于 2017-10-11 17:44 编辑

例如打开http://2017.ip138.com/ic.asp
想把这里边“您的IP是: 来自:河南省XX市 联通“--这些提取出来保存到一个TXT文档里边,谢谢谢谢

看这个贴http://www.autoitx.com/forum.php?mod=viewthread&tid=44109&from=favorites自己太菜 不会修改 特来请教

heroxianf 发表于 2017-10-11 13:18:15

如果你能获取到这些网页源码就用正则提取就好了、。

heroxianf 发表于 2017-10-11 13:25:33

本帖最后由 heroxianf 于 2017-10-11 13:26 编辑

假设你知道怎么获取源码就可以这样简单提取。


Local $Date = "<html>" & _
'<head>' & _
'<meta http-equiv="content-type" content="text/html; charset=gb2312">' & _
'<title> 您的IP地址 </title>' & _
'</head>' & _
'<body style="margin:0px"><center>您的IP是: 来自:XXX 电信</center></body></html>'

Local $Date_Out = StringRegExp($Date, '<center>(.*?)</center>', 3)
MsgBox(0, "", $Date_Out)

dingwanz 发表于 2017-10-11 17:43:37

#include <Inet.au3>
#include<IE.au3>
#AutoIt3Wrapper_UseX64=n
Dim $url_get_info = "http://2017.ip138.com/ic.asp "

$Date = BinaryToString(InetRead($url_get_info,1))

Local $Date_Out = StringRegExp($Date, '<center>(.*?)</center>', 3)
MsgBox(0, "", $Date_Out)

谢谢heroxianf 成功了

kk_lee69 发表于 2017-10-14 16:28:28

回复 4# dingwanz

請看板規解決了請修改標題
页: [1]
查看完整版本: 如何把网页的文本提取出来(问题解决感谢)