《表2 主题建模部分结果对比》

《表2 主题建模部分结果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Q-LDA主题模型的网络健康社区主题挖掘研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

使用Python爬取寻医问药网中的糖尿病版块相关数据,包括自2018年12月7日–2018年12月21日共5 736条帖子信息,数据主要包含社区用户ID、健康信息内容以及相关回复,并选取美国糖尿病协会数据库中的专业词项和语句以供健康信息相关性计算,同时为了增加精确性,在进行相关性计算时,向词项表中添加专业词项的英语缩写,例如T2DM代表2型糖尿病。使用ICTCLAS2017分词系统对实验数据进行预处理。考虑到介词以及包含负面情绪的词项在本研究背景下没有信息价值[11,30],为使实验结果更为准确,在使用Python中的Stopwords库对LDA主题模型程序进行停用词过滤时,过滤掉介词以及表示负面情绪的词项。