《表1 交互活动数据例子:基于关系圈与个体交互习惯的用户关系强度计算方法》

《表1 交互活动数据例子:基于关系圈与个体交互习惯的用户关系强度计算方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于关系圈与个体交互习惯的用户关系强度计算方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从社交网络平台中获取用户特征和用户活动数据并进行预处理。用户特征数据包括个人信息和关注的公众账号,用户活动数据包括用户发表内容和交互活动数据。本文研究方法中用到的用户特征数据只有公众账号。因为所获取的这些数据是原始数据,在使用前需对其进行预处理,去除杂数据。对发表内容及交互活动中的评论和回复数据做去停用词处理。停用词是指代词和语气助词等常用词,它们出现频率很高但对主题挖掘没有帮助。本文采用停用词字典的方法将停用词去除,并将每条交互活动记录转为交互活动文档,具体文档数据内容如表1所示。其中每一行代表一条交互活动文档内容,包含信息发送方、信息接收方、信息类型、信息内容。信息的发送方代表点赞者、评论者、回复者或转发者,信息接收方代表被点赞者、被评论者、被回复者或被转发者。信息类型分为Like、Comment、Reply和Forward。其中,Like表示点赞,Comment表示评论,Reply表示回复,Forward表示转发。信息内容的文本中涉及的表情内容用“[表情内容]”表示。根据交互活动文档选择相关用户,剔除无效用户。最终将所有信息转化为交互活动文档数据集合、公众账号数据集合和发表内容数据集合。