《表3 不同语言模型微调的错误率对比》
%
2)语言模型微调的作用.没有微调和有微调的模型性能,对比结果如表3所示.其中微调包括上文提到的分层微调和斜三角学习速率.微调语言模型在大型数据集IMDb的提高最为显著,在其他数据集上也有很好的表现.
图表编号 | XD00129609400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 傅群超、王枞 |
绘制单位 | 北京邮电大学软件学院、北京邮电大学可信分布式计算与服务教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |
%
2)语言模型微调的作用.没有微调和有微调的模型性能,对比结果如表3所示.其中微调包括上文提到的分层微调和斜三角学习速率.微调语言模型在大型数据集IMDb的提高最为显著,在其他数据集上也有很好的表现.
图表编号 | XD00129609400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 傅群超、王枞 |
绘制单位 | 北京邮电大学软件学院、北京邮电大学可信分布式计算与服务教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |