《表4 位置特征:融合表示学习与机器学习的专利科学引文标题自动抽取研究》

《表4 位置特征:融合表示学习与机器学习的专利科学引文标题自动抽取研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合表示学习与机器学习的专利科学引文标题自动抽取研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本实验选取的第二个分类特征是分割块在专利科学引文中的位置。格式标准的专利科学引文数据中,每种类型的元数据在专利科学引文中的位置是相对固定的。以GB/T 7714格式的专利科学引文数据为例,该类引文中元数据一般按照“作者、标题、出版社、日期、卷号、页码”的顺序排列,可以认为在此类引文中,第一个分割块的内容可能是此条引文的作者,而第二或第三个分割块的内容可能是此条引文的标题。因此,实验中分别以“0.1”、“0.2”、“0.3”、“0.X”表示第一、第二、第三、第X个分割块的位置,作为此分割块位置的特征值。同样以“Soutschek.J.et al.Therapeutic silencing of an endogenous gene by systemic administration of modified si RNAs.Nov.2004.Nature.vol.432.pp.173-178.”为例,该条数据各分割块的位置特征如表4所示。