《表1 20Newsgroups数据集》

《表1 20Newsgroups数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于相似度的神经网络多源迁移学习算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

20 Newsgroups数据集是一种文本数据集,共大约收录了2万篇新闻文档,大约包含20个种类,即每一篇文章属于其中一个种类。选取了comp、rec、sci、talk四个父类下的子类构造多个源领域以及目标领域。具体构造形式见表1,每一个实验组包含两个源领域,一个目标领域,每个源领域包含大约2 000个样本,在目标领域中随机均匀选择200个样本,其中均匀选取20%的数据作为带标签训练集,剩下的80%作为无标签的测试集。