找回密码
 加入
搜索
查看: 9584|回复: 15

[IE类操作] _INetGetSource()获取网页源码乱码【已解决】

 火.. [复制链接]
发表于 2012-9-2 20:57:30 | 显示全部楼层 |阅读模式
本帖最后由 83265358 于 2012-9-2 23:13 编辑

目标网页是UTF8编码的
用_INetGetSource()取到的源码中文乱码
因_INetGetSource()返回数据为二进制格式
于是我就想到了用BinaryToString()将其转为字符串
可是问题又来了, 部分字节丢失

以下是程序代码
#include <INet.au3>
Local $str = BinaryToString(_INetGetSource('http://www.m1905.com/vod/info/85488.shtml'), 4)
MsgBox(0, "源码", $str)
ConsoleWrite($str & @CRLF)
另外我发现A版的Au3.REHelper正则测试工具获取网页源码时在网址后+空格+标志4可以正常显示UTF8编码的源码,不知是怎么处理的
求A版指教
求前辈们指点
乱码图


用microsoft.xmlhttp解决了!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?加入

×
 楼主| 发表于 2012-9-2 21:09:20 | 显示全部楼层
没人在吗????????
发表于 2012-9-2 21:30:39 | 显示全部楼层
经测试 无丢字节现象
 楼主| 发表于 2012-9-2 21:35:13 | 显示全部楼层
你没仔细看吧!
发表于 2012-9-2 21:56:48 | 显示全部楼层
_INetGetSource函数核心== BinaryToString(InetRead('地址'))
出现乱码你可以改成BinaryToString(InetRead('地址'), 4)

请善用论坛搜索
 楼主| 发表于 2012-9-2 23:12:11 | 显示全部楼层
用microsoft.xmlhttp解决了!
发表于 2012-9-3 16:19:23 | 显示全部楼层
microsoft.xmlhttp
发表于 2013-8-8 20:22:10 | 显示全部楼层
感谢5楼大大
发表于 2013-11-22 11:05:19 | 显示全部楼层
请善用论坛搜索
发表于 2013-12-6 01:31:27 | 显示全部楼层
看看学习一下
发表于 2013-12-6 01:31:47 | 显示全部楼层
看看学习一下
发表于 2016-4-21 11:50:42 | 显示全部楼层
我也遇到此问题,无论用什么格式还是乱码,采用6楼方案终于解决。
$url="http://xxxxxxx.com"
$oHTTP=ObjCreate("microsoft.xmlhttp")
$oHTTP.Open("get",$url,false)
$oHTTP.Send()
$sText=$oHTTP.responseText
发表于 2016-4-21 20:47:16 | 显示全部楼层
我也遇到此问题,无论用什么格式还是乱码,采用6楼方案终于解决。
$url="http://xxxxxxx.com"
$oHTTP=Obj ...
klpfc 发表于 2016-4-21 11:50



    谢谢源码,学习了!大侠隐藏够深,注册两年了第一帖吗?
发表于 2016-10-15 14:03:00 | 显示全部楼层
学习 正需要
发表于 2017-5-28 09:24:33 | 显示全部楼层
学习了解。。谢谢分享。。
您需要登录后才可以回帖 登录 | 加入

本版积分规则

QQ|手机版|小黑屋|AUTOIT CN ( 鲁ICP备19019924号-1 )谷歌 百度

GMT+8, 2024-4-23 23:12 , Processed in 0.088527 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表