83265358 发表于 2012-9-2 20:57:30

_INetGetSource()获取网页源码乱码【已解决】

本帖最后由 83265358 于 2012-9-2 23:13 编辑

目标网页是UTF8编码的
用_INetGetSource()取到的源码中文乱码
因_INetGetSource()返回数据为二进制格式
于是我就想到了用BinaryToString()将其转为字符串
可是问题又来了, 部分字节丢失

以下是程序代码#include <INet.au3>
Local $str = BinaryToString(_INetGetSource('http://www.m1905.com/vod/info/85488.shtml'), 4)
MsgBox(0, "源码", $str)
ConsoleWrite($str & @CRLF)另外我发现A版的Au3.REHelper正则测试工具获取网页源码时在网址后+空格+标志4可以正常显示UTF8编码的源码,不知是怎么处理的
求A版指教
求前辈们指点
乱码图


用microsoft.xmlhttp解决了!

83265358 发表于 2012-9-2 21:09:20

没人在吗????????{:face (229):}

ajian55 发表于 2012-9-2 21:30:39

经测试 无丢字节现象

83265358 发表于 2012-9-2 21:35:13

你没仔细看吧!

komaau3 发表于 2012-9-2 21:56:48

_INetGetSource函数核心== BinaryToString(InetRead('地址'))
出现乱码你可以改成BinaryToString(InetRead('地址'), 4)

请善用论坛搜索

83265358 发表于 2012-9-2 23:12:11

用microsoft.xmlhttp解决了!

happyplace 发表于 2012-9-3 16:19:23

microsoft.xmlhttp

guoguo188 发表于 2013-8-8 20:22:10

{:face (280):}感谢5楼大大

stcyk 发表于 2013-11-22 11:05:19

请善用论坛搜索

aft52577 发表于 2013-12-6 01:31:27

看看学习一下

aft52577 发表于 2013-12-6 01:31:47

看看学习一下

klpfc 发表于 2016-4-21 11:50:42

我也遇到此问题,无论用什么格式还是乱码,采用6楼方案终于解决。
$url="http://xxxxxxx.com"
$oHTTP=ObjCreate("microsoft.xmlhttp")
$oHTTP.Open("get",$url,false)
$oHTTP.Send()
$sText=$oHTTP.responseText

fybhwsx 发表于 2016-4-21 20:47:16

我也遇到此问题,无论用什么格式还是乱码,采用6楼方案终于解决。
$url="http://xxxxxxx.com"
$oHTTP=Obj ...
klpfc 发表于 2016-4-21 11:50 http://www.autoitx.com/images/common/back.gif


    谢谢源码,学习了!大侠隐藏够深,注册两年了第一帖吗?

静水流深 发表于 2016-10-15 14:03:00

学习 正需要

pingfan5888 发表于 2017-5-28 09:24:33

学习了解。。谢谢分享。。
页: [1] 2
查看完整版本: _INetGetSource()获取网页源码乱码【已解决】