《表1 不同算法在该场景中的测评效果定量比较》
在定量评估部分,为了与同类算法进行比较,本文采用文[12]、[21]中提到的两个衡量标准:正确度和完整度。正确度是指在所有由两个不同类别的样本组成的样本对中,两个样本被算法聚入不同类别的情况占的比重;完整度是指所有由两个相同类别的样本组成的样本对中,两个样本被算法聚入相同团簇的情况所占的比重。为了在一定程度上消除手工标记的主观性,这里标记了三组数据,每组有2000对人工标注的轨迹对,并分别计算算法聚类结果的正确度和完整度,平均之后再与相关算法进行比较,如表1所示。相比于T-HDP[22],本文的算法能够得到更高的正确度和完整度;相比于RFT[12],本文的算法不仅能自动确定主题个数还能得到相对较高的完整度。
图表编号 | XD0065048800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 康永欣、袁丽英 |
绘制单位 | 哈尔滨理工大学自动化学院、哈尔滨理工大学自动化学院 |
更多格式 | 高清、无水印(增值服务) |