《表7 专利ADVANTAGE字段的抽取结果示例》
DII数据库中专利的摘要信息中包含新颖性(NOVELTY)、用途(USE)、优势(ADVANTAGE)、具体描述(DETAILED DESCRIPTION)等字段内容。其中,ADVANTAGE字段是描述专利所达成功效(包括正面性能的增加、负面性能的减少或优秀性能的保持等)的主要信息来源[14]。因此,为了减少不必要的标注工作量以及其他字段中冗余信息对后续神经网络模型训练效果的干扰,本文先利用正则表达式单独匹配ADVANTAGE字段,抽取结果如表7所示。其中,每一行的第一列表示专利的ID号,ID号对应的文本就是抽取的ADVANTAGE字段。
图表编号 | XD00211521500 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.10 |
作者 | 张金柱、李溢峰 |
绘制单位 | 南京理工大学经济管理学院 |
更多格式 | 高清、无水印(增值服务) |