《表1 数据集:基于翻译模型的科研合作预测研究》

《表1 数据集:基于翻译模型的科研合作预测研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于翻译模型的科研合作预测研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

干细胞是当今生命科学研究的前沿与热点,正孕育着重大的科学突破与巨大的产业带动,是中国科学院“十三五”规划中60项重大突破之一。本文基于干细胞领域的相关文献构建实验数据,首先在生物医学文献数据库Pub Med中,以“Me SH Major Topic=stem cell”为检索策略,将时间段限定为2000-2019年,共搜集到127 173篇论文。在论文数据处理中,通过作者和机构解决作者重名问题,即作者全称和机构全称完全相同的作者才被认为是同一作者。如果一篇论文中存在三名作者author1、author2和author3,则在author1和author2,author1和author3,author2和author3之间皆建立合作关系。最后将作者作为节点,合作关系作为边,文献的标题和摘要作为边的描述文本,构建干细胞领域的科研合作网络,并形成相应的训练集和测试集。为了更好地评估模型的性能,从合作网络中抽取出不同规模的子数据集Net-S(Small)、Net-M(Medium)和Net-L(Large),按照8∶2的比例将数据划分为训练集和测试集,如表1所示。