《表2 数据集的统计信息》
本文选取来源于搜狗实验室、中山大学两个中文新闻数据集以及英文新闻数据集AG_news,三个数据集均是中英文文本分类中最常用的新闻语料库.选取搜狗数据集10个类别(体育、财经、房产、家居、教育、科技、时尚、时政、游戏、娱乐)共20000条数据,中山大学数据集8个类别(交通、健康、娱乐、教育、文化、科技、游戏、经济)共18000条数据.AG_news数据集4个类别(World、Sports、Business、Sci/Tech)共27200条数据.具体实验信息如表2所示.
图表编号 | XD00141231900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 朱烨、陈世平 |
绘制单位 | 上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院、上海理工大学信息化办公室 |
更多格式 | 高清、无水印(增值服务) |