《表2 六个行业领域未登录词统计》
从每个行业领域各提取50个职位,使用分词器Han LP进行分词。造成分词错误的主要因素是歧义和未登录词。因此,排除分词结果中由歧义造成的分词错误字段,剩下的分词错误字段便可认为是未登录词。六个行业领域未登录词统计如表2所示。
图表编号 | XD0067701800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 曾浩、詹恩奇、郑建彬、汪阳 |
绘制单位 | 武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |