《表1 用户主题关键字表》
内容特征:使用内容特征刻画用户偏好。内容特征包括:主题、话题、位置、表情符、发文设备、第三方软件、出行方式、语气词、标点符号、食物、电影、音乐、旅游13小类特征。主题特征:主题特征刻画用户的兴趣偏好,使用LDA提取用户主题特征,将单个用户所有博文看作一个文档,使用困惑度确定用户主题数,得到180维用户主题,根据主题关键词人工筛选117维有意义的主题,如金融理财、历史、政治等,部分主题关键字如表1所示。话题特征:用户在某热点事件下发文时,需标注话题标签,如“#中国”,话题刻画用户对热门事件的关注情况,本文提取提及次数大于50次的微博话题50504个,使用LDA主题模型对话题特征进行融合,最终得到200维用户话题特征,包括购物、汽车、创意家居等。
图表编号 | XD00129458900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 索晓阳、王伟 |
绘制单位 | 北京交通大学智能交通数据安全与隐私保护技术北京市重点实验室、北京交通大学智能交通数据安全与隐私保护技术北京市重点实验室 |
更多格式 | 高清、无水印(增值服务) |