《表1 景区数据统计:基于热词语义聚类的领域特征挖掘方法》
本文使用了旅游评论数据作为领域语料进行LBM的实验。旅游语料是基于爬虫技术从“猫途鹰”旅游网站爬取,语料数据统计量见表1。从表1中可以发现,最大评论数的景区与最小评论数的景区评论数量差距很大,而语料的标准差达到了859.74,这说明语料中各景区评论数量的分布非常不均衡。
图表编号 | XD0082516100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 庄建昌、武娇、顾兴全、洪彩凤 |
绘制单位 | 中国计量大学理学院、中国计量大学理学院、中国计量大学标准化学院、中国计量大学理学院 |
更多格式 | 高清、无水印(增值服务) |