《表1 汽车论坛文本数据示例》

《表1 汽车论坛文本数据示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《专业社交媒体中的主题图谱构建方法研究——以汽车论坛为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本实验通过编写基于Scrapy框架的爬虫程序,抓取“汽车之家”论坛中的汽车评论帖子,选取了10个热门车型论坛进行爬取,包括迈腾论坛、雅阁论坛、凯美瑞论坛等。爬取内容包括帖子标题、正文内容、配图文本等信息,其中配图文本是指正文中图片的说明文本。配图文本往往包含发帖人想表达的关键信息,因此本文在构建主题图谱时将正文内容与配图文本合并起来考虑。帖子的时间范围为从2016年9月—2017年9月,共爬取约20万篇帖子内容。汽车论坛帖子示例如表1所示。