chishingchan 发表于 2022-2-16 15:03:24

【已解决】ANSI 的日文文本如何转换为可查看的非乱码(Unicode)文本?

本帖最后由 chishingchan 于 2022-2-16 23:22 编辑



ANSI2UNI.AU3

Local $hFileOpen = FileOpen(@ScriptDir & "\wndpatch.txt", 16)
Local $sFileRead = FileRead($hFileOpen)
FileClose($hFileOpen)
$new = BinaryToString($sFileRead, 4)
MsgBox(0, "乱码", $new)
;If FileExists(@ScriptDir & "\new_wndpatch.txt") Then
;      FileDelete(@ScriptDir & "\new_wndpatch.txt")
;      FileWrite(@ScriptDir & "\new_wndpatch.txt",$new)
;Else
;      FileWrite(@ScriptDir & "\new_wndpatch.txt",$new)
;EndIf


chishingchan 发表于 2022-2-16 15:08:23

原文本使用记事本打开

itzyx 发表于 2022-2-16 15:48:20

chishingchan 发表于 2022-2-16 15:08
原文本使用记事本打开

不要用记事本打开,右键打开方式 改成word,word打开时他会让你选语言,选成日本语就好了 (只是会普通的方法,如果用AU3做自动转换不会。。。)

afan 发表于 2022-2-16 17:07:10

_WinAPI_MultiByteToWideChar()

chishingchan 发表于 2022-2-16 21:23:05

afan 发表于 2022-2-16 17:07
_WinAPI_MultiByteToWideChar()

这个帮助里没有例子!不会用。麻烦a大给个例子,谢谢!

afan 发表于 2022-2-16 23:00:54

#include <WinAPI.au3>
Local $str = '亂僜僼僩柤亃Window Mode Patch for Game'
MsgBox(0, $str, _WinAPI_MultiByteToWideChar($str, 932, $MB_COMPOSITE, True))

chishingchan 发表于 2022-2-16 23:13:17

标识符        .NET 名称        其他信息
037        IBM037        IBM EBCDIC US-Canada
437        IBM437        OEM 美国
500        IBM500        IBM EBCDIC International
708        ASMO-708        阿拉伯语(ASMO 708)
709                阿拉伯语 (ASMO-449+、BCON V4)
710                阿拉伯语 - 透明阿拉伯语
720        DOS-720        阿拉伯语 (透明 ASMO) ;阿拉伯语 (DOS)
737        ibm737        OEM 希腊语 (437G) ;希腊语 (DOS)
775        ibm775        OEM 管理; (DOS)
850        ibm850        OEM 多语言拉丁语 1;西欧 (DOS)
852        ibm852        OEM Latin 2;欧洲中部 (DOS)
855        IBM855        OEM 西里尔文 (主要为俄语)
857        ibm857        OEM 土耳其语;土耳其 (DOS)
858        IBM00858        OEM 多语言拉丁语 1 + 欧洲符号
860        IBM860        OEM 葡萄牙语;葡萄牙语 (DOS)
861        ibm861        OEM 管理;中国 (DOS)
862        DOS-862        OEM 希伯来语;希伯来 (DOS)
863        IBM863        OEM 法语加拿大;加拿大法语 (DOS)
864        IBM864        OEM 阿拉伯语;阿拉伯语 (864)
865        IBM865        OEM 国家/地区;美国 (DOS)
866        cp866        OEM 俄语;西里尔文 (DOS)
869        ibm869        OEM 现代希腊语;希腊语、现代 (DOS)
870        IBM870        IBM EBCDIC 多语言/ROECE (Latin 2) ;IBM EBCDIC 多语言拉丁语 2
874        windows-874        泰语(Windows)
875        cp875        IBM EBCDIC 希腊语现代
932        shift _ jis        ANSI/OEM 日语;日语 (Shift-JIS)
936        gb2312        ANSI/OEM 简体中文 (中国、新加坡) ;简体中文 (GB2312)
949        ks _ c _ 5601-1987        ANSI/OEM 韩语 (统一 Hangul 代码)
950        big5        ANSI/OEM 繁体中文 (台湾;香港特别行政区、中国) ;繁体中文 (Big5)
1026        IBM1026        IBM EBCDIC 土耳其语 (拉丁语 5)
1047        IBM01047        IBM EBCDIC Latin 1/Open System
1140        IBM01140        IBM EBCDIC US-Canada (037 + Euro 符号) ;IBM EBCDIC (美国-加拿大-欧洲)
1141        IBM01141        IBM EBCDIC 德国 (20273 + Euro 符号) ;IBM EBCDIC (德国-欧洲)
1142        IBM01142        IBM EBCDIC Denmark-Norway (20277 + Euro 符号) ;IBM EBCDIC (丹麦-挪威-欧洲)
1143        IBM01143        IBM EBCDIC Finland-Sweden (20278 + Euro 符号) ;IBM EBCDIC (芬兰-瑞典-欧洲)
1144        IBM01144        IBM EBCDIC 意大利 (20280 + Euro 符号) ;IBM EBCDIC (意大利-欧洲)
1145        IBM01145        IBM EBCDIC 拉丁语 America-Spain (20284 + Euro 符号) ;IBM EBCDIC (西班牙-欧洲)
1146        IBM01146        IBM EBCDIC 英国 (20285 + Euro 符号) ;IBM EBCDIC (英国-欧洲)
1147        IBM01147        IBM EBCDIC 华北 (20297 + Euro 符号) ;IBM EBCDIC (法国-欧洲)
1148        IBM01148        IBM EBCDIC 国际 (500 + 欧元符号) ;IBM EBCDIC (国际-欧洲)
1149        IBM01149        IBM EBCDIC 冰岛语 (20871 + 欧元符号) ;IBM EBCDIC (冰岛语-欧洲)
1200        utf-16        Unicode UTF-16,little endian 字节顺序 (ISO 10646) 的 BMP;仅适用于托管应用程序
1201        unicodeFFFE        Unicode UTF-16,big endian 字节顺序;仅适用于托管应用程序
1250        windows-1250        ANSI 中欧;中欧 (Windows)
1251        windows-1251        ANSI 西里尔语;西里尔文 (Windows)
1252        windows-1252        ANSI 拉丁语 1;西欧 (Windows)
1253        windows-1253        ANSI 希腊语;希腊语 (Windows)
1254        windows-1254        ANSI 土耳其语;土耳其语 (Windows)
1255        windows-1255        ANSI 希伯来语;希伯来 (Windows)
1256        windows-1256        ANSI 阿拉伯语;阿拉伯 (Windows)
1257        windows-1257        ANSI 波罗语;波罗的语 (Windows)
1258        windows-1258        ANSI/OEM 越南语;越南语 (Windows)
1361        Johab        韩语(Johab)
10000        macintosh        MAC 罗马;西欧 (Mac)
10001        x-mac-日语        日语(Mac)
10002        x-mac-chinesetrad        MAC 繁体中文 (Big5) ;繁体中文 (Mac)
10003        x-mac-韩语        朝鲜语(Mac)
10004        x-mac-阿拉伯语        阿拉伯语(Mac)
10005        x-mac-希伯来语        希伯来语(Mac)
10006        x-mac-希腊语        希腊语(Mac)
10007        x-mac-西里尔文        西里尔语(Mac)
10008        x-mac-chinesesimp        MAC 简体中文 (GB 2312) ;简体中文 (Mac)
10010        x-mac        罗马尼亚语(Mac)
10017        x-mac-乌克兰语        乌克兰语(Mac)
10021        x-mac-泰语        泰语(Mac)
10029        x-mac-ce        MAC Latin 2;欧洲中部 (Mac)
10079        x-mac-冰岛语        冰岛语(Mac)
10081        x-mac-土耳其语        土耳其语(Mac)
10082        x-mac-克罗地亚语        克罗地亚语(Mac)
12000        utf-32        Unicode UTF-32,little endian字节顺序;仅适用于托管应用程序
12001        32BE        Unicode UTF-32,big endian 字节顺序;仅适用于托管应用程序
20000        x-Chinese _ CNS        CNS 中国台湾;繁体中文 (CNS)
20001        x-cp20001        TCA 台湾
20002        x _ Chinese-Eten        Eten 中国区;繁体中文 (Eten)
20003        x-cp20003        IBM5550 台湾
20004        x-cp20004        TeleText 台湾
20005        x-cp20005        Wang 台湾
20105        x-IA5        IA5 (IRV International Alphabet No. 5、7 位) ;西欧 (IA5)
20106        x-IA5-德语        IA5 德语 (7 位)
20107        x IA5-瑞典语        IA5 瑞典语 (7 位)
20108        x IA5-挪威语        IA5 挪威 (7 位)
20127        us-ascii        US-ASCII (7 位)
20261        x-cp20261        不是61
20269        x-cp20269        ISO 6937 非间距重音
20273        IBM273        IBM EBCDIC Germany
20277        IBM277        IBM EBCDIC Denmark-Norway
20278        IBM278        IBM EBCDIC Finland-Sweden
20280        IBM280        IBM EBCDIC 意大利
20284        IBM284        IBM EBCDIC Latin America-Spain
20285        IBM285        IBM EBCDIC 英国
20290        IBM290        IBM EBCDIC 日语片假名扩展
20297        IBM297        IBM EBCDIC France
20420        IBM420        IBM EBCDIC 阿拉伯语
20423        IBM423        IBM EBCDIC 希腊语
20424        IBM424        IBM EBCDIC 希伯来语
20833        x-EBCDIC-KoreanExtended        IBM EBCDIC 韩语扩展
20838        IBM-泰语        IBM EBCDIC 泰语
20866        koi8-ru-r        俄语 (KOI8-R) ;西里尔文 (KOI8-R)
20871        IBM871        IBM EBCDIC 管理
20880        IBM880        IBM EBCDIC 西里尔文俄语
20905        IBM905        IBM EBCDIC 土耳其语
20924        IBM00924        IBM EBCDIC Latin 1/Open System (1047 + Euro 符号)
20932        EUC-JP        日语(JIS 0208-1990 和0212-1990)
20936        x-cp20936        简体中文 (GB2312) ;简体中文 (GB2312-80)
20949        x-cp20949        韩语 Wansung
21025        cp1025        IBM EBCDIC 西里尔文Serbian-Bulgarian
21027                (弃用)
21866        koi8-ru-u        (KOI8-U) ;西里尔文 (KOI8-U)
28591        iso-8859-1        ISO 8859-1 拉丁语 1;西欧 (ISO)
28592        iso-8859-2        ISO 8859-2 欧洲中部;欧洲中部 (ISO)
28593        iso-8859-3        ISO 8859-3 拉丁语 3
28594        iso-8859-4        ISO 8859-4 中国
28595        iso-8859-5        ISO 8859-5 西里尔文
28596        iso-8859-6        ISO 8859-6 阿拉伯语
28597        iso-8859-7        ISO 8859-7 希腊语
28598        iso-8859-8        ISO 8859-8 希伯来语;希伯 (ISO-Visual)
28599        iso-8859-9        ISO 8859-9 土耳其语
28603        iso-8859-13        ISO 8859-13 芬兰
28605        iso-8859-15        ISO 8859-15 拉丁语 9
29001        x-欧洲        Europa 3
38598        iso-8859-8-i        ISO 8859-8 希伯来语;希伯 (ISO-Logical)
50220        iso-2022-日本        ISO 2022 日语(无片假名);日语 (JIS)
50221        csISO2022JP        ISO 2022 日语和片假名;日语 (JIS-Allow 1 字节假名)
50222        iso-2022-日本        ISO 2022 日语 JIS X 0201-1989;日语 (JIS-Allow 1 字节假名 - SO/SI)
50225        iso-2022-kr        ISO 2022 韩语
50227        x-cp50227        ISO 2022 简体中文;简体中文 (ISO 2022)
50229                ISO 2022 繁体中文
50930                EBCDIC 日语 (片假名) 扩展
50931                EBCDIC US-Canada和日语
50933                EBCDIC 韩语扩展和韩语
50935                EBCDIC 简体中文扩展和简体中文
50936                EBCDIC 简体中文
50937                EBCDIC US-Canada繁体中文
50939                EBCDIC 日语 (拉丁语) 扩展和日语
51932        euc-jp        EUC 日语
51936        EUC-CN        EUC 简体中文;简体中文 (EUC)
51949        euc-kr        EUC 韩语
51950                EUC 繁体中文
52936        hz-gb-2312        HZ-GB2312 简体中文;简体中文 (HZ)
54936        GB18030        Windows XP 和更高版本: GB18030 简体中文 (4 个字节) ;简体中文 (GB18030)
57002        x-iscii-de        ISCII 梵文
57003        x-iscii        ISCII 孟加拉语
57004        x-iscii-ta        ISCII 泰米尔语
57005        x-iscii-te        ISCII 泰卢固语
57006        x-iscii-as        ISCII 阿萨姆语
57007        x-iscii-或        ISCII 奥里亚语
57008        x-iscii-ka        ISCII 埃纳德文
57009        x-iscii-ma        ISCII 马拉雅拉姆语
57010        x-iscii-gu        ISCII 古吉拉特语
57011        x-iscii-pa        ISCII 旁遮普语
65000        utf-7        Unicode (UTF-7)
65001        utf-8        Unicode (UTF-8)

chishingchan 发表于 2022-2-16 23:15:17

本帖最后由 chishingchan 于 2022-2-16 23:17 编辑

#include <WinAPIConv.au3>

Local $hFileOpen = FileOpen(@ScriptDir & "\wndpatch.txt", 512)
Local $sFileRead = FileRead($hFileOpen)
FileClose($hFileOpen)
$new = _WinAPI_MultiByteToWideChar($sFileRead, 932, 0, True)
MsgBox(0, "日文", $new)
If FileExists(@ScriptDir & "\new_wndpatch.txt") Then
      FileDelete(@ScriptDir & "\new_wndpatch.txt")
      FileWrite(@ScriptDir & "\new_wndpatch.txt",$new)
Else
      FileWrite(@ScriptDir & "\new_wndpatch.txt",$new)
EndIf


页: [1]
查看完整版本: 【已解决】ANSI 的日文文本如何转换为可查看的非乱码(Unicode)文本?