《表6 添加命名实体特征的分类实验效果》

《表6 添加命名实体特征的分类实验效果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融入实体特征的典籍自动分类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

将命名实体作为特征词加入到特征向量中,依然用信息增益、TF-IDF、互信息和卡方检验来统计特征词的权重,结果如表6所示。可以发现,在特征维度为100时,应用信息增益这个计算量的准确率为93.4%,得到显著提升。在维度为500时,分类实验准确率达到97.8%;在特征维度为1 000时,分类的实验准确率为98.7%;此时,实验效果已接近饱和;在特征维度为1 500时,分类的实验准确率依然为98.7%;在特征维度为2 000时,分类的实验准确率为97.8%。再观察加入命名实体特征词后用TF-IDF统计量的实验效果。在特征维度分别为100、500、1 000、1 500、2 000时,文本分类的准确率分别是90.8%、98.3%、96.5%、98.3%、96.9%。