《表1 语料来源及检索关键词》
本文使用网络爬虫从腾讯、新浪、IT时代网等常用网站爬取了IT、创业、学术、时政、娱乐五大类新闻语料,总共15 000篇,每一类3 000篇。检索关键词挑选自2016互联网各领域热词,每个领域选取三个检索词。实验数据具体选择如表1所示。
图表编号 | XD0035692900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 刘铭瑀、刘学亮、胡骏 |
绘制单位 | 合肥工业大学计算机与信息学院、合肥工业大学计算机与信息学院、合肥工业大学计算机与信息学院 |
更多格式 | 高清、无水印(增值服务) |