获取网页源码后乱码的问题
本帖最后由 newx 于 2009-9-26 15:30 编辑用:_INetGetSource ("http://www.xxxxx.com"),其中有的地方原本是<a href=xx>aa</a>会出现<a href=xx>aa?/a>;
用BinaryToString ( _INetGetSource ("http://www.xxxxx.com),4)也是;
用BinaryToString ( StringToBinary(_INetGetSource ("http://www.xxxxx.com),4),4)也是;
还有在网页中有显示中文的地方,有的得到的会是乱码(以上三种方法均会出现乱码),请求解决!
谢谢了!!! BinaryToString
标志 = 1 (默认), binary 数据为 ANSI 编码
标志 = 2, binary 数据为 UTF16 小编码
标志 = 3, binary 数据为 UTF16 大编码
标志 = 4, binary 数据为 UTF8 编码
看看是否对的上,乱码就是编码问题。或者你设置成1试试,主要看你获取的网页是什么编码。设置4是UTF-8 自已解决了:-)
使用microsoft.xmlhttp获取网页源码后就行了
页:
[1]