《表3 模型参数设置:上下文感知与层级注意力网络的文档分类方法》

《表3 模型参数设置:上下文感知与层级注意力网络的文档分类方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《上下文感知与层级注意力网络的文档分类方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验过程中模型的超参数在验证集上进行微调,而最终的算法性能比较在测试集中进行。本文中,GRU网络的单元个数设置为50,那么Bi-GRU网络生成的向量维数为100。随机初始化的单词上下文向量uw和句子上下文向量us的维度设置为100。对于模型的训练,将词嵌入的维度设置为100,采用大小为64的批处理,采用动量为0.9的随机梯度下降法(stochastic gradient descent,SGD)来训练所有的模型,并且在验证集上使用网格搜索来选择最佳学习率。此外,为了防止网络神经元出现共同适应性,本文还使用大小为0.5的dropout来随机丢弃网络中的神经元。经过多次调整,选取一组最优模型参数,如表3所示。