《表1 景区数据统计:基于热词语义聚类的领域特征挖掘方法》

《表1 景区数据统计:基于热词语义聚类的领域特征挖掘方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于热词语义聚类的领域特征挖掘方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文使用了旅游评论数据作为领域语料进行LBM的实验。旅游语料是基于爬虫技术从“猫途鹰”旅游网站爬取,语料数据统计量见表1。从表1中可以发现,最大评论数的景区与最小评论数的景区评论数量差距很大,而语料的标准差达到了859.74,这说明语料中各景区评论数量的分布非常不均衡。