《表2 话题模型表示结果比较》
为了测试双向量模型表示方法在话题追踪中的有效性,对SADV-TT方法中的话题和微博向量化步骤进行改造,形成不同的话题追踪方法:采用基于TFIDF特征选择方法的双向量模型的方法称为TFIDF-TT方法;采用基于BTM主题模型进行特征选择并采用词嵌入的方式向量化话题和微博的方法称Vector-TT方法;采用基于BTM主题模型提取特征然后采用VSM方法向量化话题和微博的方法称为VSM-TT方法;采用基于BTM主题模型特征选择方法的双向量模型的方法称为DoubleVector-TT方法.在相同实验数据下将Double Vector-TT方法与TFIDF-TT方法、Vector-TT方法以及VSM-TT方法进行比较,以验证双向量模型表示方法的可行性.相似度阈值参数设置:TFIDF-TT=0.2,Vector-TT=0.45,VSM-TT=0.04,DoubleVector-TT=0.2.表2给出的是4种方法在3个话题上的平均漏检率、平均误检率以及平均(CDet)norm指标.
图表编号 | XD0079867800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 黄畅、郭文忠、郭昆 |
绘制单位 | 福州大学数学与计算机科学学院、福建省网络计算与智能信息处理重点实验室、空间数据挖掘与信息共享教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |