《表7 监督与半监督方法比较 (基于改进的TF-IDF) Tab.7 Comparison between supervised and semi-supervised methed (based o
基于朴素贝叶斯的EM算法利用了未标注数据,所以该部分实验没有使用十折交叉验证的方法计算评价指标,而是采用文本分类中常见的数据集划分法7/3法,即70%的标注数据为训练集,30%的标注数据为测试集。实际训练时,不同特征提取方法选用的特征维度是前文比较特征提取方法时对应F1值最高的特征维度。表7~表9分别是3种特征选择方法下监督方法和半监督方法的实验对比结果。
图表编号 | XD0019725100 严禁用于非法目的 |
---|---|
绘制时间 | 2018.12.01 |
作者 | 王海杰、吴琼 |
绘制单位 | 天津大学管理与经济学部、天津大学管理与经济学部 |
更多格式 | 高清、无水印(增值服务) |