《表2 人名识别模式集Table 2 Set of name recognition patterns》
事实上,中国人名形式具有多样性、任意性和复杂性,主要分为两类:完整形式和非完整形式[11]。经过一些语料测试发现,表2中所使用的人名识别模式集还不能满足所有的中国人名形式,主要是一些非完整形式的中国人名,例如“双名的末字+后缀”(对应模式集为DG)这种形式的人名就没有包括在内,而这种形式的人名也是非常常见的,比如一个人全名为“张宇鹏”,我们可能称他“鹏哥”。
图表编号 | XD0025794000 严禁用于非法目的 |
---|---|
绘制时间 | 2018.06.30 |
作者 | 栾伟锋、张欢欢 |
绘制单位 | 华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |