taoyehui 发表于 2023-8-22 11:42:18

求助 怎么计算 一段文字数据的 词频,就是这个端文字里 每个词出现的重复次数

求助 怎么计算 一段文字数据的 词频,就是这个端文字里 每个词出现的重复次数

zghwelcome 发表于 2023-8-22 11:47:56

1. 正则提取所有词语到数组
2. 用字典对象统计次数
3. 字典数据转数组,然后排序

qq413774005 发表于 2023-8-22 12:43:40

本帖最后由 qq413774005 于 2023-8-22 12:44 编辑

$txt = "民民民中国人民中国人中国中中中中中"
$dxt = "中国" ; 搜索匹配的字符串
Local $sText = StringReplace($txt, $dxt, ",")
Local $its = @extended;返回替换操作的次数保存在宏 @extended 中
MsgBox(4096, "提示", "找到重复: " & $its & " 次", 5)
Local $aDays = StringSplit($sText, ",") ;数组
For $i = 1 To $aDays - 1 ; 循环数组
MsgBox(4096, "", "数组[" & $i & "] - " & $aDays[$i] & $dxt)
Next
MsgBox(4096, "", "数组[" & $i & "] - " & $aDays[$i])
;代码写的烂了点,就这样吧
页: [1]
查看完整版本: 求助 怎么计算 一段文字数据的 词频,就是这个端文字里 每个词出现的重复次数