《表2 部分变体词的主要关联词语的置信度计算结果》
%
作为初步实验数据,抽取电子邮件2 500条,论坛发帖1 500条,电子小说600篇作为训练样本。通过统计分析发现:与变体词所在语句中同时使用概率较大的高频词基本集中在前7个高频词中,因此这里m值设为7。由于实验数据较少,这里只选取了在实验数据集出现的其中50个变体词。表1和表2是部分变体词的7个关联词语的支持度和置信度计算结果。
图表编号 | XD007366500 严禁用于非法目的 |
---|---|
绘制时间 | 2018.03.15 |
作者 | 赵俊杰 |
绘制单位 | 安徽财经大学工商管理学院 |
更多格式 | 高清、无水印(增值服务) |