《表2 系统性能评价表:高并发汉英信息抽取系统的设计与实现》
式中:Correct Word为该文本中正确的关键词;ComputeWord为该文本中系统提取的所有关键词;AllCorrectWord为人手工标注的所有关键词。测试的文本为人工标注的50篇新闻文本,其中每篇文本手工标注10个关键词以及5个关键短语,摘要句的数量根据文本的长度来决定。在50篇文本中共选出500个关键词,250个关键短语以及181句文本摘要,使用上述的三个指标对该系统的性能进行测试。此外,采用开源工具HanLP的关键词提取和短语提取以及开源工具BOSON的摘要提取作为BaseLine,与本系统采用的算法进行一系列的对比。实验结果如表2所示。
图表编号 | XD0078709300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.15 |
作者 | 张少迪、艾山·吾买尔、郑炅、石刚 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |