《表1 不同词语在不同类别文本中的出现次数》
不同类别的新闻文本具有其常用的词语集合,或专业领域的词语集。本文采用复旦语料库,从中选择太空、艺术、农业、经济、政治五个类别中的随机200篇文章,计算不同词语在不同类别文本中的出现频率,结果如表1所示。“灌溉”“农村”等词语在“农业”类别中出现的次数较多,而在其他类别的文本中出现次数较少甚至不会出现;同理,“钢琴”“航天”等词语则分别在“艺术”与“太空”两类文本集中出现的次数较多。
图表编号 | XD0090317500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 张璐、芦天亮、杜彦辉 |
绘制单位 | 中国人民公安大学信息技术与网络安全学院、中国人民公安大学信息技术与网络安全学院、中国人民公安大学网络空间安全与法治协同创新中心、中国人民公安大学信息技术与网络安全学院、中国人民公安大学网络空间安全与法治协同创新中心 |
更多格式 | 高清、无水印(增值服务) |