《表4 排名前20的初步分词词频统计》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向活动的网络媒体监测与建模分析:IVFC案例解析》
本文使用基于深度学习模型的Fudan DNN-NLP进行文本数据的分词,其在序列标注网络结构的基础上,采用快速卷积代替窗口模型,并且引入前向标签与不当状态的交互信息对网络进行进一步优化[17]。分词前使用正则表达式去除文本中的标点符号、网址等无效内容,并在分词过程中加入停用词词典。对初步分词后的结果进行词频统计,排名前20的词汇见表4。
图表编号 | XD00128228400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 孙星恺、王晓、陆浩 |
绘制单位 | 中国科学院自动化研究所复杂系统管理与控制国家重点实验室、中国科学院大学、中国科学院自动化研究所复杂系统管理与控制国家重点实验室、青岛智能产业技术研究院、中国科学院自动化研究所复杂系统管理与控制国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |