《表1 哈工大近义词林扩展版分级示意表》
本文使用“哈工大近义词林扩展版”作为基础数据,利用其中的近义词关系获取局部的词与词的可扩展性。“哈工大近义词林扩展版”中,每组近义词包含多个词语,这些词语间存在近义关系,例如“人、士、人物、人士、人氏、人选”,这些近义词组之间的词语为最高级别的近义词关系。同时,如表1所示,“哈工大近义词林扩展版”中给出了5种级别的近义词关系。随着级别的递增,词义刻画越来越细,到了第5层,每个分类里词语数量已经不大,很多只有一个词语,已经不可再分,被称为原子词群、原子类或原子节点。不同级别的分类结果可以为自然语言处理提供不同的服务。例如第4层的分类和第5层的分类在信息检索、文本分类、自动问答等研究领域得到应用。实验证明,对词义进行有效扩展,或者对关键词做同义词替换可以明显改善信息检索、文本分类和自动问答系统的性能。
图表编号 | XD00189092700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.10 |
作者 | 刘高军、方晓、段建勇 |
绘制单位 | 北方工业大学信息学院、北方工业大学信息学院、北方工业大学信息学院 |
更多格式 | 高清、无水印(增值服务) |