《表1 实验参数表:融合BSRU和ATT-CNN的化学物质与疾病的关系抽取方法》

《表1 实验参数表:融合BSRU和ATT-CNN的化学物质与疾病的关系抽取方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合BSRU和ATT-CNN的化学物质与疾病的关系抽取方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验的第一步是数据处理,使用word2vec工具和Skipgram模型将数据集中的文本转换成词向量表示,词向量维度设置为50维.第二步将训练后的词向量输入到BSRU模块中提取文本单词的语义特征、位置特征、上下文信息特征等,特征向量的维度以最大的向量维度为准,其他向量不足时用0向量填充.BSRU将所有逐元素相乘的操作放入一个核函数中,使模型计算效率明显提高,大幅加快了模型的训练速度.第三步将多种词特征拼接后输入到ATT-CNN模块,注意力机制根据多种特征信息结合语义给予目标关系更高权重,降低其他并列实体关系对化学物质与疾病关系抽取的干扰,CNN模块卷积层使用多个不同大小的卷积核对多种词特征进行学习计算,卷积核的权重矩阵值,初始值随机生成,随着训练进行改变,在同一个特征映射矩阵中使用相同卷积核,减少参数的训练时间.经实验验证使用多个不同大小的卷积核的CNN能够有最佳的表现,卷积核的大小设置为3、5、7.池化层使用分段池化策略,在降低维度的同时能够最大化的保存文本特征.实验最后使用softmax分类器完成关系分类,完成关系抽取任务.实验中主要参数如表1所示.