《表1 原始BTM与改进后的BTM主题提取结果对比》

《表1 原始BTM与改进后的BTM主题提取结果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《重大公共卫生事件中的舆情分析方法研究——以新冠肺炎疫情为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用BERT模型生成的词向量充分挖掘词语间的语义关系,并用词向量的替换使输入数据量减少,不仅可以减少BTM模型计算复杂度,减少特征提取难度,还可以使BTM模型提取的主题词语义差异增大,重合主题减少。以武汉气愤类文本主题提取结果为例(表1),在仅输出前5类概率较高的主题时,原始方法中第3、第4类语义重合度较大,应合并为一类;本方法可提取出原始方法提取结果中缺失的”封城相关”类主题。同时相同主题中的关键词更为独立,例如“野味相关”类主题中原始BTM主题提取结果将“野味”、“野生动物”重复提取为关键词,而经过BERT词向量替换后,“野生动物”一词被替换为“野味”,增加了”野味“在该主题中的权重。