本帖最后由 298311657 于 2012-4-4 01:05 编辑
根据GB编码写的一个函数,只能识别3755 个常用汉字,所以测试字符串的槑囧两个字取不到首拼字母
比起5L 3mile大侠的函数弱了很多,不过因为没有使用递归,所以效率也好很多。如果只处理常用汉字,可以选择这个,如果要处理所有汉字(常用+生僻+繁简),就使用3mile大侠的函数吧
Global Const $secPosValueList[24] = [ 1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5600 ]
Global Const $firstLetter[23] = [ 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'w', 'x', 'y', 'z' ]
MsgBox(0,'',GetPy('32爱好2(是钱4”:槑囧'))
Func GetPy($mystr)
Local $py, $tmp, $byte, $secPosValue
For $j = 1 To StringLen($mystr)
$tmp = ""
$byte = StringToBinary(StringMid($mystr,$j,1))
$secPosValue = (Dec(Hex(BinaryMid($byte,1,1)))-160)*100 + (Dec(Hex(BinaryMid($byte,2,1)))-160)
For $i = 0 To 22
If ($secPosValue >= $secPosValueList[$i] And $secPosValue < $secPosValueList[$i + 1]) Then
$tmp = $firstLetter[$i]
ExitLoop
EndIf
Next
If $tmp = "" Then
$py &= StringMid($mystr,$j,1)
Else
$py &= $tmp
EndIf
Next
If StringLen($py) Then Return $py
Return $mystr
EndFunc
|