《表1 数据集：基于翻译模型的科研合作预测研究》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于翻译模型的科研合作预测研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

干细胞是当今生命科学研究的前沿与热点，正孕育着重大的科学突破与巨大的产业带动，是中国科学院“十三五”规划中60项重大突破之一。本文基于干细胞领域的相关文献构建实验数据，首先在生物医学文献数据库Pub Med中，以“Me SH Major Topic=stem cell”为检索策略，将时间段限定为2000-2019年，共搜集到127 173篇论文。在论文数据处理中，通过作者和机构解决作者重名问题，即作者全称和机构全称完全相同的作者才被认为是同一作者。如果一篇论文中存在三名作者author1、author2和author3，则在author1和author2，author1和author3，author2和author3之间皆建立合作关系。最后将作者作为节点，合作关系作为边，文献的标题和摘要作为边的描述文本，构建干细胞领域的科研合作网络，并形成相应的训练集和测试集。为了更好地评估模型的性能，从合作网络中抽取出不同规模的子数据集Net-S(Small）、Net-M(Medium）和Net-L(Large），按照8∶2的比例将数据划分为训练集和测试集，如表1所示。

图表编号	XD00198134700 严禁用于非法目的
绘制时间	2020.10.25
作者	陈文杰
绘制单位	中国科学院成都文献情报中心
更多格式	高清、无水印（增值服务）