《表4 基础特征模板:基于本体的水稻育种方法应用知识库构建》
特征模板可为CRF模型提供统一的特征函数的生成模式,对已选择的特征进行重新组合或筛选,便于考虑特定位置的信息.通过特征模板可以将专利文本中的上下文信息加入到模型中,综合利用各种外部信息[18-19].表4为常用的基础特征模板.上下文信息主要是以当前值及前后若干个词为观察窗口,观察窗口越大,模板中上下文信息获取得越多,相对模型也越复杂,过大的观察窗口会大大降低模型效率,容易产生过拟合现象;相反地,观察窗口过小则会导致可利用信息少,识别效率低.因此,特征模板及观察窗口的选取对水稻实体的识别及知识库的构建具有重大意义.
图表编号 | XD0083400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.10 |
作者 | 赖英旭、李亚娟、刘静 |
绘制单位 | 北京工业大学信息学部计算机学院、北京工业大学信息学部计算机学院、北京工业大学信息学部计算机学院 |
更多格式 | 高清、无水印(增值服务) |