《表2 污垢元素含量:预训练语言模型BERT在下游任务中的应用》
与Devlin[2]实验设置一样,batch-size设定为16,学习率设定为2×10-5,MSL长度设置为512,在这些参数设定下,在验证集上4个数据集都取得了最优的效果。实验结果如表2所示[9]。
图表编号 | XD00183557800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 段瑞雪、巢文宇、张仰森 |
绘制单位 | 北京信息科技大学计算机学院、国家经济安全预警工程北京实验室、北京信息科技大学计算机学院、北京信息科技大学信息管理学院、国家经济安全预警工程北京实验室 |
更多格式 | 高清、无水印(增值服务) |