《表2 不同主题数的分类器的准确率》

《表2 不同主题数的分类器的准确率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于交叉熵与困惑度的LDA-SVM主题研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

研究中,根据困惑度、以及困惑度与交叉熵相结合的算法,并结合各种分类器进行对比实验,通过仿真来验证该算法的优越性。在进行对比实验时,将降维算法加以统一,LDA主题个数寻优实验选择PCA降维,同样,选择TF-IDF特征向量加权算法;SVM的核函数,选择高斯核函数。定义困惑度计算得到的主题数为Perp_K,定义困惑度和交叉熵相结合的主题数量为PerpSimla_K,通过本文提出的交叉熵与困惑度计算公式分别得到最优主题个数,Perp_K=200,PerpSimla_K=230。不同主题数的分类器的准确率见表2。