《表1 交互活动数据例子:基于关系圈与个体交互习惯的用户关系强度计算方法》
从社交网络平台中获取用户特征和用户活动数据并进行预处理。用户特征数据包括个人信息和关注的公众账号,用户活动数据包括用户发表内容和交互活动数据。本文研究方法中用到的用户特征数据只有公众账号。因为所获取的这些数据是原始数据,在使用前需对其进行预处理,去除杂数据。对发表内容及交互活动中的评论和回复数据做去停用词处理。停用词是指代词和语气助词等常用词,它们出现频率很高但对主题挖掘没有帮助。本文采用停用词字典的方法将停用词去除,并将每条交互活动记录转为交互活动文档,具体文档数据内容如表1所示。其中每一行代表一条交互活动文档内容,包含信息发送方、信息接收方、信息类型、信息内容。信息的发送方代表点赞者、评论者、回复者或转发者,信息接收方代表被点赞者、被评论者、被回复者或被转发者。信息类型分为Like、Comment、Reply和Forward。其中,Like表示点赞,Comment表示评论,Reply表示回复,Forward表示转发。信息内容的文本中涉及的表情内容用“[表情内容]”表示。根据交互活动文档选择相关用户,剔除无效用户。最终将所有信息转化为交互活动文档数据集合、公众账号数据集合和发表内容数据集合。
图表编号 | XD00104772300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.24 |
作者 | 琚春华、陶婉琼、马希骜 |
绘制单位 | 浙江工商大学管理工程与电子商务学院、浙江工商大学工商管理学院、浙江工商大学管理工程与电子商务学院、浙江工商大学工商管理学院、浙江工商大学计算机与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |