《表1 文本表达替换关系表》

《表1 文本表达替换关系表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于网络文本分析的游客旅游地形象感知对比研究——以甪直古镇和南浔古镇为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了提高所收集样本的有效性,在用ROST CM6软件对游客评论进行高频词分析、认知类目分析、社会网络语义分析及情感分析之前,对样本做以下预处理:(1)人工删除样本中的图片、游客ID、发表时间等信息,只保留游客的文字评论内容,并将重复、无意义的评论删除,最终获得甪直古镇和南浔古镇的有效评论分别为710条和2 865条;(2)在不改变游客评论原意的基础上,对样本中意义相同的词句进行统一替换(部分替换关系如表1所示),将处理后的样本保存为txt文本文档;(3)在user.txt中建立自定义词表,将软件无法识别的关键词纳入其中,如“甪直”“西塘”等;(4)在highfreinvalid.txt中建立过滤词表,过滤评论中与旅游地形象感知没有密切关系的高频词,如“还是”“一个”“但是”“我们”等。