《表1 4种特征选择方法下的KNN分类效果》

《表1 4种特征选择方法下的KNN分类效果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于词向量语义扩展的网络文本特征选择方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表1是在KNN分类器下不同特征维数时IG、ECE和CHI与扩展后最优的特征选择方法对应的分类效果对比表,从表1可以看出,3种特征选择方法在特征维数等于1000时取得了在5个维度下的最优分类效果,分类准确率分别为88.01%、87.79%、88.97%。为了验证新方法的特征提取效果,在1000维基础上使用词向量技术进行特征扩展,200维为扩展特征数目最优值。当使用词向量对3种特征选择方法进行特征扩展后,3种特征选择方法对应的分类准确率均有较大幅度提升,其中与特征300维相比较,IG提高了4.93%,ECE提高了6.64%,CHI提高了4.6%。与特征1000维相比较,ECE提高了1.93%,IG提高了1.18%。CHI提高了0.43%。综合图4及表1的数据显示,使用词向量对分类主题进行语义特征扩展能够把与主题具有相关语义关系的特征提取出来,联合初始特征一起文档表示时能够提高分类准确率。