《表2 部分变体词的主要关联词语的置信度计算结果》

《表2 部分变体词的主要关联词语的置信度计算结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于关联规则的中文变体词识别算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
%

作为初步实验数据,抽取电子邮件2 500条,论坛发帖1 500条,电子小说600篇作为训练样本。通过统计分析发现:与变体词所在语句中同时使用概率较大的高频词基本集中在前7个高频词中,因此这里m值设为7。由于实验数据较少,这里只选取了在实验数据集出现的其中50个变体词。表1和表2是部分变体词的7个关联词语的支持度和置信度计算结果。