《表3 水样水质化验结果:基于深度学习的中文网络招聘文本中的技能词抽取方法》

《表3 水样水质化验结果:基于深度学习的中文网络招聘文本中的技能词抽取方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的中文网络招聘文本中的技能词抽取方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于没有明确的标准如何将数据集划分为训练/验证/测试集,在实验中将数据集进行两轮交叉验证。首先将整个数据集划分成5份,选择其中的80%作为训练数据,而将其余20%用作测试数据。然后,再次将训练数据划分成10份,选择其中的90%作为最终训练数据,并将其余的10%用作验证数据。换句话说,将全部数据的72%作为训练数据,将8%作为验证数据,将20%作为测试数据。每次实验的训练周期为100个周期,通过验证集找出训练集在这100个周期内最佳网络模型参数后再使用测试集进行测试,以获得本次验证的结果。表3中分别展示了用于训练、验证和测试数据集的句子数、技能词数量。值得注意的是,由于每个句子中包含的技能词数量不同,训练/验证/测试数据集中的技能词数量会随着每次划分而动态变化,因此,技能词数量的范围也在表中。