《表3 语料库中训练集和测试集的选取情况》

《表3 语料库中训练集和测试集的选取情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《文本分类中一种特征选择方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验中使用的语料库是复旦大学计算机信息与技术系国际数据库中心自然语言处理小组整理的中文语料库[16]。选用其中的体育、历史、太空、政治、环境、经济、艺术、计算机,共8个类别。其中各类别文本的选取情况如表3所示。