《表2 不同平滑方法对应的平滑结果》
在上述微博示例的基础上,采用基于全局信息、基于作者建模和本文提出的平滑方法分别对博文B进行平滑,平滑结果如表2所示。从表2可以看出,如果采用全局信息进行平滑,微博B的稀疏性虽得到解决,但微博4会引入噪声词,如“路边社”、“中美贸易战”等;采用方法2进行平滑,可在一定程度上实现对微博B的扩展,但没有充分地引入微博B的所有相关词;与前两种方法相比,采用本文提出的方法3进行平滑,结果更为理想,为微博B引入了更多的相关词,且避免了噪声词的引入。
图表编号 | XD0039056600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.24 |
作者 | 吴树芳、张雄涛、朱杰 |
绘制单位 | 河北大学管理学院、天津大学管理与经济学部、河北大学管理学院、中央司法警官学院信息管理系 |
更多格式 | 高清、无水印(增值服务) |