《表1 数据集信息:基于GRU网络的互联网信息挖掘》
训练过程在GPU上运行,数据集CCFLABAnn中1340条句子作为训练集,100条句子作为开发集,360条句子作为测试集;数据集CONLL2000中8836条句子作为训练集,100条作为开发集,2012条作为测试集,其中开发集用于对模型参数进行调整,数据集具体信息如表1所示。在参数设置方面,因为使用GPU训练,因此忽略梯度下降时选取数据条数对训练速度的影响,采用全批次梯度下降;双向GRU单元隐层特征设置为200;损失函数为负对数似然损失;为了防止过拟合,dropout层设置丢弃率为0.2。
图表编号 | XD0024689100 严禁用于非法目的 |
---|---|
绘制时间 | 2018.03.25 |
作者 | 李骁、黄征 |
绘制单位 | 上海交通大学电子信息与电气工程学院、上海交通大学电子信息与电气工程学院、卫士通摩石实验室 |
更多格式 | 高清、无水印(增值服务) |