《表3 不同组合方式在search dev数据集上的结果单位:》

《表3 不同组合方式在search dev数据集上的结果单位:》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Pre-RoBERTa-MTL的中文机器阅读理解模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

编码层在使用Ro BERTa编码器进行编码之后,可以将12个Transorfomer层的输出进行不同的组合或者拼接来作为上下文嵌入矩阵输入到后续的模型中进行训练。在使用上节最优超参数组合的条件下,尝试了几种不同的组合方式在线下search的开发集进行了对比实验,结果如表3所示。