《表9 通用领域未登录词识别准确率对比》
/%
微博覆盖内容较广,属于通用领域数据。从COAE2014提供的数据中选取5 000条微博作为实验数据,分别采用文献[4,5]和本文方法识别其中的未登录词。由于难以标注微博中的未登录词,所以仅以准确率作为实验结果的评价标准。实验结果如表9所示。实验结果表明,本文方法在识别微博未登录词中取得了较好的效果,其准确率高于文献[4,5]方法。
图表编号 | XD0067702000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 曾浩、詹恩奇、郑建彬、汪阳 |
绘制单位 | 武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |