《表2 不同主题数的分类器的准确率》
研究中,根据困惑度、以及困惑度与交叉熵相结合的算法,并结合各种分类器进行对比实验,通过仿真来验证该算法的优越性。在进行对比实验时,将降维算法加以统一,LDA主题个数寻优实验选择PCA降维,同样,选择TF-IDF特征向量加权算法;SVM的核函数,选择高斯核函数。定义困惑度计算得到的主题数为Perp_K,定义困惑度和交叉熵相结合的主题数量为PerpSimla_K,通过本文提出的交叉熵与困惑度计算公式分别得到最优主题个数,Perp_K=200,PerpSimla_K=230。不同主题数的分类器的准确率见表2。
图表编号 | XD0056290000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 薛佳奇、杨凡 |
绘制单位 | 西安建筑科技大学信息与控制工程学院、西安建筑科技大学理学院 |
更多格式 | 高清、无水印(增值服务) |