《表1 测试样本举例:基于词语相似度的语义选择限制知识获取》
从1998年1月的人民日报语料中抽取动宾搭配作为正例,使用3种策略生成反例,正反例样本中动词和名词均为双音节词.对于正反例样本,由3位标注者进行确认,确保每一对样本中正例名词与动词搭配的合理性要高于反例名词.3位标注者标注结果一致的样本予以保留,最终得到3种反例生成策略下的测试样本个数分别为:pre/887个,post/820个,rand/865个.表1给出3个测试样本的例子,verb是动词,pos是正例名词,pre、post、rand为3种策略下的反例名词,可见正例的合理性均要高于反例.
图表编号 | XD0088378700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.15 |
作者 | 贾玉祥、赵倩倩、李育光、郑一、昝红英 |
绘制单位 | 郑州大学信息工程学院、郑州大学信息工程学院、郑州大学信息工程学院、郑州大学信息工程学院、郑州大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |