《表4 排名前20的初步分词词频统计》

《表4 排名前20的初步分词词频统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向活动的网络媒体监测与建模分析:IVFC案例解析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文使用基于深度学习模型的Fudan DNN-NLP进行文本数据的分词,其在序列标注网络结构的基础上,采用快速卷积代替窗口模型,并且引入前向标签与不当状态的交互信息对网络进行进一步优化[17]。分词前使用正则表达式去除文本中的标点符号、网址等无效内容,并在分词过程中加入停用词词典。对初步分词后的结果进行词频统计,排名前20的词汇见表4。