《表2 IPM中采用的中文语言模式示例》
在此研究工作中,我们针对中文语言的特性进行定制.尽管中文语言具有高度灵活性,但仍有部分语言模式可以为选择高置信度的概念对提供有效的统计量.表2列举了一部分中文语言模式,其中Is-A和Such-As模式为两个概念对存在上下位关系提供了正面证据;同下位词关系模式则相反,表征这两个概念可能都是某概念的下位词,因而他们之间极有可能不存在上下位关系.对于数据集DU中概念对(xi,yi),根据上述模式在语料库的统计量,计算正向得分PS(xi,yi)和负向得分NS(xi,yi).从DU中选择D(t)这一关系选择的过程被建模成带成本的最大覆盖问题(Budgeted maximum coverage problem)[51].这一问题可以通过贪心算法进行近似优化.算法的实现细节请参阅文献[11].
图表编号 | XD00163168500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 汪诚愚、何晓丰、宫学庆、周傲英 |
绘制单位 | 华东师范大学软件工程学院、华东师范大学计算机科学与技术学院、华东师范大学软件工程学院、华东师范大学数据科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |